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本 书 虽然 是 《商业 智能 深入 浅 出 Cognos, Informatica 技术 与 应 
用 》 一 书 的 修订 版 ， 但 在 结合 各 方面 的 反馈 意见 之 后 ， 对 内 容 上 做 了 很 
多 调整 ， 力 求 最 狐 、 最 细 。 同 时 书 中 将 商业 智能 和 大 数据 有 机 地 结合 起 
来 ， 增 加 了 一 些 相应 的 章节 和 和 案例， 扩充 了 知识 点 ， 几 乎 涵盖 了 商业 智 
能 领域 的 所 有 知识 。 本 书 并 不 推崇 细节 性 的 理论 知识 讲述 ， 因 为 每 一 部 
分 理论 都 可 以 写成 一 本 书 。 本 书 主 要 针对 如 何 解决 项 目 中 所 遇 到 的 问题 ， 
以 及 商业 智能 项 目 开 发 的 一 般 流程 。 本 书 还 力图 帮助 初学 者 快速 进入 到 
项 目 之 中 ， 所 以 本 书 对 他 们 来 说 具有 极 高 的 参考 价值 。 

本 书 内 容 可 以 分 成 如 下 儿 个 部 分 。 

理论 篇 : 主要 包括 商业 智能 概述 、 数 据 仓 库 理 论 知 识 、 数 据 控 掘 和 
分 析 、 大 数据 理论 知识 等 内 容 。 

项 目 篇 : 主要 包括 商业 智能 项 目 需 求 的 定义 、 商 业 智 能 项 目 模 型 的 
建立 、 商 业 智 能 数据 仓库 系统 应 用 实例 、 大 数据 架构 与 实践 、 电 力行 业 
和 人 金融 行业 的 商业 智能 案例 等 内 容 。 

工具 篇 : 详细 介绍 两 大 商业 智能 工具 Cognos 与 Informatica 的 理论 知 
识 和 使 用 方法 。 

实践 篇 : 包括 Cognos 报表 的 开发 、 部 署 和 实践 等 内 容 。 

本 书 还 附 赠 了 部 分 源 代码 和 一 些 有 价值 的 文档 模板 。 
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谁 需要 阅读 本 书 


人 简 而 言 之， 如 果 您 是 一 直 关 注 丙 业 智 能 和 大 数据 领域 的 开发 人 员 、 架 构 师 、 咨 询 顾 问 或 
者 是 相关 专业 的 师 生 ， 无 论 是 初学 还 是 已 有 一 定 工作 经 验 ， 这 本 书 都 适合 您 。 

考虑 到 很 多 读者 刚刚 涉足 这 个 领域 ， 所 以 本 书 不 会 使 用 星 梁 难 懂 的 语言 ， 并 尽量 用 浅显 
易 异 的 方式 去 说 明 问 题 。 在 内 容 方面 ， 本 书 几 乎 涵盖 了 商业 智能 的 方 方 面 甸 ， 包 括 一 些 染 构 
的 思想 和 工具 的 使 用 ， 更 重要 的 是 ， 本 书包 含 了 商业 省 We os tie 
过 程 中 的 难点 和 解决 方案 。 本 书 并 不 拘泥 于 细 市 部 分 ， 但 是 试图 帮助 读者 深入 理解 商业 
的 核心 技术 ， 包 括 相 关 的 理论 、 规 划 思 想 和 实际 案例 等 。 

硕 望 本 书 能 够 融 您 进入 到 真正 的 数据 世界 中 。 在 数据 的 海洋 中 目 由 地 发 挥 ， 不 断 地 创造 


















































本 书 涵盖 的 内 容 可 以 分 成 如 下 几 个 部 分 。 

理论 篇 : 主要 包括 商业 智能 概述 、 数 据 仓库 理论 知识 、 数 据 挖掘 和 分 析 、 大 数据 理论 知 
识 等 内 容 。 

JH: 主要 包括 商业 智能 项 目 需求 的 定义 、 商 业 智 能 项 目 模 型 的 建立 、 商 业 智 能 数据 

统 应 cest 大 数据 架构 与 实践 、 电 力行 业 和 金融 行业 的 商业 智能 案例 等 内 容 
THA: 详细 介绍 两 大 商业 智能 工具 Cognos 与 Informatica 的 理论 知识 和 使 用 方法 。 
实践 篇 : 包括 Cognos 报表 的 开发 、 部 署 和 实践 。 
本 书 附 赠 部 分 源 代码 和 一些 有 价值 的 文档 模板 。 
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目前 ， 很 多 企业 引入 了 商业 智能 。 商 业 智 能 已 经 成 为 了 企业 信息 化 的 重要 的 解决 方案 和 
技术 手段 。 从 零售 企业 到 金融 机 构 ， 从 电力 行业 到 环保 产业 ， 商 业 智 能 正在 引起 一 场 商 业 分 
析 和 战略 决策 的 单 命 。 预 计 ， 很 快 束 会 有 超过 半数 的 企业 使 用 商业 智能 技术 去 开拓 和 抢占 市 
场 了 。 
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小 时 候 冒 经 有 一 本 书 给 我 留 下 了 深刻 的 印象 ， 大 概 内 容 是 教 小 学 生 如 何 写作 文 的 ， 包 括 
如 何 写 议论 文 、 记 叙 文 、 若 文 等 。 书 中 并 没有 很 刻板 地 去 前 述 写 作 的 步骤 ， 而 是 通过 主人 公 
CMPD 的 一 个 个 小 故事 ， 把 一 些 看 似 偶 然 ， 却 又 非 角 合 理 的 情节 ， 包 括 在 公园 、 火 车 站 、 
旅游 景点 等 场景 下 ， 以 对 话 的 形式 将 写作 的 方法 一 一 告诉 读者 ， 语 言 风趣 幽 幢 。 映 为 读者 的 
我 谈 后 有 了 相当 大 的 收获 ， 尽 管 已 时 隔 儿 二 年， 仍然 让 我 不 能 筷 怀 。 本 书 的 内 容 ， 虽 然 不 能 
以 故事 情节 或 者 对 话 的 形式 展现 给 大 家 ,但 是 也 力求 不 用 晓 涩 难 异 的 语言 去 解释 概念 ， 而 是 
用 人 简 里 易 异 的 例子 去 说 明 问 题 ， 以 来 既 能 让 初学 者 快速 进入 到 商业 智能 的 世界 中 ， 也 可 让 专 
业 人 士 在 轻松 阅读 的 过 程 中 有 所 收益 。 












































IV 


sb 3 


我 要 感谢 帮助 我 完成 这 本 书 的 所 有 人 。 

首先 感谢 刘 国 峰 对 本 书 的 重要 页 献 ， 他 为 本 书 的 修订 付出 了 心血 和 努力 。 

感谢 公司 的 同事 们 ， 他 们 都 以 各 种 方式 为 本 书 的 修订 做 出 了 页 献 。 

最 后 , 也 是 最 重要 的 , 我 要 感谢 杀人 给 予 我 的 不 懈 支 持 , 我 的 母 杀 (张丽华 )、 父 亲王 
吐 林 )， 还 有 我 的 岳父 《本 一 贤 )、 岳 母 〈 起 桂 荣 )， 特 别 是 我 的 妻子 (玲玲) 和 2 E f] AC 
儿 王 预 营 )， 他 们 给 予 了 我 最 大 的 精神 支持 和 帮助 。 如 果 没 有 他 们 ， 我 很 难 想象 能 完成 这 
AB. 




















BUE 
致谢 
第 1 章 
1.1 
1.2 
1.3 
1.4 
1.5 
1.6 
第 2 章 
2.1 
22 


VI 








E 论 篇 
商业 各 能 向 让 Wn ] 
商业 智 能 概述 re — a l 
1.1.1 商业 智能 的 定义 OT EA ST OED N EAT TA E E A TT 1 
1.1.2 商业 智能 的 作用 TO OO ————— RR E A ——— 3 
1.1.3 商业 智能 的 处 理 过 程 Terr TM 3 
1.1.4 商业 智能 的 功能 本 3 
1.1.5 商业 智能 的 发 展 趋势 yuwebeddvcvalke Mie vut ess ES OO E Oy SO Te ON ST Oe Ri gu e ui EK ERES 4 
Sec DASS DL D E redo teet ae Gaia de pudet bet Deb b ettet diei aic ep 5 
1.2.1 数据 仓库 ————————M—————ÁÓ————Á——Ó—————ÁÁ—————————Á € 5 
1.2.2 数据 挖掘 和 分 析 —— €———Á————— ————————————ár————— E RR 5 
12.3 ETL 处 理 技 术 ne E 5 
1.2.4 联机 分 析 处 理 (OLAP) 技术 ERWVET TERRAE E da vU P TEE SUV D Aq TES Re ER VA RA A AES GNU EE RR EUR d EUER VE ded 5 
1.2.5 可 视 化 分 析 PE EPEE E rei e err ET ro ese i EE A De ERN SEENS 5 
1.2.6 大 数据 技术 Oda ed T EP ON LUE VINE EVO ed ee od Va 0 odd CT ed EA VO Ub CR UO RED MR P Ve 6 
1.2.7 商业 智能 元 数据 管理 T EE i ples Peveleds cesi OAC OAR avail Ki cu L e wide UN ibd runi Ki E pDLE 6 
| mE MEI eueuppacside impari enp ade ir tapas voe pad aee ed 6 
1.3.1 商业 智能 的 实施 方法 有 7 
1:3:5 商业 智能 的 实施 步骤 ———————————————————Á———— RR e 7 
区 人 有 站 国生 o e T 8 
DD A e E E E EE g 
pa A EA IM IM M MM MM ML ML Ma M LE ADM A 9 
数据 仓库 的 理论 知识 ""——————————————— ——X— —— —— — ——Q 11 
数据 仓库 概述 dn en 11 
2.1.1 数据 仓库 产生 的 背景 —————————— —————————— !——— 11 
2.1.2 数据 仓库 定义 ed re de dd E A 11 
2-13 数据 仓库 和 商业 智能 之 间 的 关系 —Á—————————Á—— ——Á— P —— € 12 
P O T A e 12 
22.1 面 问 主 题 于 12 
PROAR 集成 性 disieckigcdsiuet i pP ILI I eV LII LU I LP I D FII I LIA e LIED i LV E ELI I I ICI SIN LINT I ID IU EE 13 
2-9 稳定 性 —Ó —————— Á——————À ERROR ————— —ÓÁ———————— ER 13 
220-4 有 反映 历史 变化 —— —— OE NT Te ee tT Ae SS TE ee oe A 13 


"UNE Co etd UR 14 
24 HO ee E Be | e estu ein ite iea eia Nii 14 
2 4 数据 仓库 开发 过 程 介绍 ed — l4 
2.5.1 SVIAVHUS IMEE——————— € 14 
PEE ERU E 15 
2.5.33. TERI ER mme eene eere eene 15 
26 数据 仓库 系统 组 成 部 分 介绍 ——————————————— n 17 
2.6.1 数据 源 分 析 eeeeeertteeertteeeeerreseeeeesseeeeseeeeeessseeeeersseeeeerseeeeersseeeeerseeeeessseeeeesseeeeessseees | 
2.6.2 ”数据 迁移 oeeeeeeeeetrtreteerrrreeeerreeeeeerrseeeeersseeeesnseeeeerneeeeeerseeeeerssereeessseeeessseeeessseeeeessseeet 18 
2.6.3 选择 数据 的 存储 结构 mme 19 
nu: ——————— E! 19 
De A 20 
"MAURUS 20 
2.7.2 ”逻辑 模型 E 21 
2.7.3 物理 模型 E 23 
28 数据 集 市 介绍 ee E 24 
2.8.1 ŽORE RR 24 
2.82 ”数据 集 市 和 数据 仓库 的 联系 和 区 别 enm mmm 26 
2.83 数据 集 市 的 目标 分 析 mH eene eene eene 27 
2.84 数据 集 市 的 技术 特性 meme eee eene AT 
29 ODS 介绍 n 28 
29.1 ODS 的 概述 «eee eene eene enn rennen nennen nennen nennen 28 
292 ODS AZ HR EE ER. RGPERRERIDCRI eH HH 32 
293 基于 ODS 和 基于 数据 仓库 的 OLAP 之 间 的 美 系 mee 23 
294 ODS 系统 的 功能 全 nn 33 
OCORBEO NER AULAE———————— 34 
2 10 数据 仓库 实施 详细 步骤 "——— —— —— ——Y—— Y — —— € 34 
"AUNBMEEEALIEE—————«(«—————— 34 
24.02 Jd EWDEASEAMT mee eee eene eene eene 35 
2.10.3 设计 ODS 系统 和 Ne 35 
"AULUL ANUAL RR 37 
2.10.5 数据 集 市 建 模 E 38 
2.10.6 “数据 源 分 析 E 38 
2.10.7 数据 的 获取 与 整合 pe 38 
UUNMSASAE—————«(«———————Á 38 
2.10.9 ”报表 展现 …… 39 
241 ERARE PET EEN E a a a e entes en etennna 39 
2.12 数据 仓库 建设 路 线 图 ————— M — ——————Á—— S 40 
2.13 数据 仓库 的 作用 ———— nd E EEE 41 





2.4 AOE PE Wo MM MH HH HH 42 









































2.15 本 章 小 Zt RS 42 
第 3 音 数据 挖掘 和 分 析 理 论 知 讽 HH M M MM AHHIHHMMMRHeHeHnnB 44 
3.] ft 是 数据 挖掘 和 44 
MEE e ATA aO. 44 
3.3 ”数据 挖掘 常用 算法 有 45 
34 ”数据 仓库 和 数据 挖 气 之 间 的 关系 … HemHHHRHMMHMHBeÜÜly 45 
3.5 HEIZE E RBERReeeeeeeM M M M M eH HII 45 
36 “数据 控 掘 的 主要 应 用 一 一 客户 精准 营销 46 
3.6.1 客户 精准 营销 背景 和 46 

3.6.2 ”关于 旅游 行业 的 客户 精准 营销 46 

3.6.3 ”关于 银行 业 的 客户 精准 营销 emm Hee 49 

27 本 章 小 zu Hm nn nee mE INTE 50 
第 4z 商业 智能 ETEL JEER e HH Hee 51 
41 ETL 在 数据 仓库 中 的 重要 地 位 51 
42 ETL 的 一 般 过 程 ———————————ÓÁ—— € ———— € 52 
4.3 研究 ETL 的 本 质 ————————————ÁÁ——— — 52 
44 ETL 的 体系 结构 T 54 
45 ETL 的 难点 ——— —————À —————— ——————————á———! 54 
4.66 主流 的 ETEL LH ee M M HMM 54 
4.7 ETL 的 作用 T ———————————————— M Á——Á—— 55 
4.8 详解 ETL 过 程 ee breve aeri i vales r edid eu oval er Ge Veles Pe dtr erc relie Peru eue oval e V 55 
4.8.1 数据 抽取 eeeeeeeeeereeeeeeeeereeeeeeerseeeeerssereeerssereessseeeeessseeeeersseeeessseeeeersseeeeesseeeeessseeeeessee 56 
"PEMEULIIL——— 56 

"EP Lc——«(«(«——————— 57 

"Y EEJLUILRRSSSR— 5g 

" EEEUUNZJSPOQHEww——— 50 

49 ETL 优化 人 59 
4.10 ETL VETE YO HER p eee Henne 59 
4.11] ETL 的 框架 结构 人 60 
4.12 ETL 的 实施 策略 "——————— —— —— ————— E 61 
4.13 本 章 小 A EENES EEES PEE E E ed AE EE a EE T E AS Á—————— —— P—— 62 
第 $5 章 商业 智能 联机 分 析 处 理 理 论 简 介 m mmHÜmmHHÜmHnmmmmIHHHIIR 64 
5] OLAP 介绍 a E E E E E 64 
52 OLAP 系统 与 OLTP 系统 的 区 别 ———— —————Á—Á—— T 65 
53 OLAP 的 实现 方法 eee eene 65 
54 OLAP 的 基本 目标 和 特 上 em HH Hee 67 
55 üt. OLAP 的 过 程 和 67 
56 OLAP 与 数据 仓库 的 英 系 68 


VIH 


5.7 
5.8 
5.9 
第 6 章 
6.1 
6.2 
6.3 
第 7 章 
2d 
72 
7.3 
7.4 
7.5 
7.6 
第 8 章 
8.1 
82 
83 
8.4 
8.5 
8.6 


8.7 


第 9 章 
9.] 
9.2 
9.3 
9.4 
9.5 

第 10 章 
10.1 
10.2 


10.3 


OLAP 系统 的 实施 过 程 Suena rale i uw cae oo ee dale uev Cabe tul dala ole tu Gala tutti Gala ate E Gala tut ED GaU le d e Gala Tet Pale 68 


OLAP 模型 的 设计 与 实现 MH mH) 69 
本 章 小 zu ARCU TP EO PR SE NAO A Ee E 70 
me A AA eE Ia 7] 
什么 是 数据 可 视 化 分 析 RR TS UE EU a EU OCE E KE VERRE CIR E RUOTLI RAE CORREA EVO TRE ER PUE EN UU d 71 
Jirga n] BAI aA N 72 
本 章 小 zh TOT WE cocer HH TI 
大 数据 理论 知识 ——ÀÓ———————É—————À— MM 74 
AGBS ES IJ RE EH eem eee eee ene 74 
什么 是 大 数据 ?3 een 75 
大 数据 处 理 技术 "———————— ————————— 75 
大 数据 应 用 案例 e M Hmmm eme 76 
大 数据 和 传统 商业 智能 的 结合 站 76 
本 章 小 zh Tome a € 76 
eNe ea E e et 77 
元 数据 的 EY. POIENI OI E E EEI E T E E EE E E E O 77 
元 数据 的 重要 性 eee M M Hmmm mme mmm meme eee eee 78 
元 数据 的 类 型 78 
元 数据 的 作用 Hee eme mmm meme He 78 
元 数据 的 管理 eem ee ene eee eene 79 
元 数据 包含 的 内 容 oe 80 
本 章 小 zu Toc err 80 
项 H 篇 

商业 智 圣 项目 要 来 的 定 入 81 
Dess st 81 
Ee I2 qa m T 84 
系统 原 m 的 建立 和 90 
验收 和 评审 的 内 容 怕 ee 90 
本 章 小 ZH Go a a E a E a E E EE a 9] 
商业 知 能 项 目 必 型 的 建站 ee 92 
数据 模型 Pi VE Jg Dll] HH HH HHmHeeememmHHeeem HH] 02 
企业 模型 的 意 —((€(««««— 02 
10.2.1 企业 模型 的 定 NL eee eene enne eene ennneen nennen nnne nennen 02 
10.22. SUE VEI V 站 02 
10.2.3 ”企业 数据 模型 和 其 他 模型 之 间 的 美 系 eme 93 
10.2.4 5 4 VAR ERGAB AC BUE eem eee ener 93 
10.2.5 ”企业 数据 模型 转换 到 数据 仓库 模型 的 步骤 站 94 
概念 模型 的 设计 96 


10.4 3Z EACH HH Henn 97 

















10.4.1 ODS 逻辑 模型 oeeeereeerrreererreeeerseeeerereersereerseeeesseeerrereesseeeersteeereteesseeeesseeeesseeessereessees 97 
10.4.2 ”数据 仓库 逻辑 模型 EE — 101 
10.4.3 “数据 集 市 逻辑 模型 E— 106 

10.$ JJEESSCUEV eee M] HMM 109 
10.5.1 ODS 物理 模型 的 设计 meme eee enemies 109 
10.52 ”数据 仓库 物理 模型 的 设计 mme eee enne 110 
10.53. “数据 集 市 物理 模型 的 设计 mme eee enne 112 

10.6 本 章 小 结 MEO CUM de dn a ne doen LT MERO 116 
第 11 章 商业 智能 数据 仓库 系统 应 用 实例 HH HH 118 
MEE S Lr rcx Paca du 118 
11.2. Ze G FERE MM IRR HIR 119 
11.3 ANVR RE RARE e HMM HHMIIRRMMMeÁl 119 
11.4. 决策 分 析 系 统一 般 的 部 署 方案 和 步骤 ee MMMMMMMMMMHMMHMMHHHMIIIRHMRRRRRRSHee 120 
11.4.1 提供 系统 安装 软件 的 体系 结构 PN 120 
11.4.2 部署 系统 的 数据 库 环境 站 121 
11.4.3 ETL 环境 的 部 署 eeeeeeeereeeeereeeeereeeerreeeerseeeerseeeesseeesrereeerereesseeeenseeeesseeeerereessereesseeees 122 
IMFEELJ LS S que ——mR—————: 122 

11.5 数据 仓库 建设 的 难 上 ee M HM HH HH eH 122 
11.6 AkxkNAE ————————————————————— "———— 123 
第 12 音 商业 银行 数据 仓库 建设 规划 HH 124 
12.1 商业 银行 数据 仓库 建设 概况 eem eemmHHHHeHHHHHHR 124 
12.2 HATE WN mÁmMdt dg Ent 9 MM 124 
12.3. EMT HRS FEE VER M ES a] B eee MM 125 
12.4 商业 银行 数据 仓库 建设 思路 及 系统 情况 M M MM MM 126 
12.4.1 某 商业 银行 建设 数据 仓库 时 遇 到 的 挑战 站 126 
i242 - Oc DRE: UO 2e DU UST ebd sec itai i ieu eie denis 127 
12.4.3 ”对 该 行 数据 仓库 目标 架构 的 建议 mmm 128 

12.$ 商业 银行 数据 仓库 建设 启示 129 
12 6 本 章 小 结 divano d CUM CLIP E EE LI n LI mE Lt, 130 
第 13 音 ”电力 行业 数据 仓库 的 建设 规划 HH 131 
13.4 ”电力 行业 数据 仓库 建设 难点 ee MR 131 
132. WENI EE Gs EEXP RI] een A HHRRHHIHHMPRRReHRIIRRR 132 
13.3 ”电力 行业 数据 仓库 能 力 瘟 图 e MM 132 
13.4 ”数据 仓库 促进 电力 业务 的 发 展 HH 133 
13.5 数据 仓库 建设 策略 比较 134 
13.6 ”电力 行业 数据 仓库 模型 建立 过 程 HH) 134 
13.7 ”电力 行业 数据 仓库 的 架构 设计 MMMMMHRReRHIHMMR 134 
13 8 AENA A EE E PO A ee Pro E NE E A E tqq pa 136 


第 14 音 商业 智能 项 目 规 划 和 管理 ee HH HH 138 






































SD A a aaa 138 
i42- IE eta 4 UB SC eere thesi iter e a phon eit n uit ben ete ne a pbE 139 
14.3. *E VL A BUR RR E EE A eret rennen ri E 140 
14.4 如 何 定义 商业 智能 项 目的 进 庆 enn nnn nn nnn nnn 140 
i45. ifs MEE SEI E BU 过 和 141 
14.6 AEA — EOE ETE E OE E E A E N E E ee 142 
第 1S 音 商业 业 智 能 应 用 介绍 站 143 
15.1 x [VAS SE v He rS Jg Dll] e MMHHHHHHHHMHMMMRRHeReeÜes 143 
152 ”商业 智能 应 用 的 实施 步骤 M MReReAHHHMHMHHIIIHMÁMRRRHeeB 144 
15.3 iniqui LI 有 的 应 用 功能 … 144 
15.4 EANA s SER] e M MM HH HH I HH MMBIRHRRRRRReÁ 145 
15.5 W E Pau E E E A MM A E E MM pda M E E E RM EM S E ETON 146 
第 16 Æ GEHE, 5£3&3DJDZA-— HH 147 
161 ETL 的 定义 和 总 体 架 构 nnn mH emm HH eH 147 
162 ETL 的 加 载 方法 Hee eee eene 150 
16.2.1 以 时 间 蕉 作为 加 载 条 件 eee ene ene enne nennen 150 
1622. AFER FL EGRE HIKITIA em 153 
162.3. XE REA EOM EEUU] SGUETT BRIDE eee ee enn 153 
16.24 ARMERET CECI JE Rn e ene ene enn 156 

163 利用 ETL 构建 企业 级 数据 仓库 RN 157 
164 ETL HJ DURER m mH HH eene 158 
165 ETL 的 备份 与 恢复 和 160 
16.5.1 数据 的 备份 160 
16.5.2 ”数据 备份 存放 的 介质 以 及 目录 结构 站 160 
16.5.3 ETL 程序 的 备份 —— 161 
16.54 数据 的 恢复 方案 eeerreertrrereererreerseeersreereeerserereeeesererserernterseeenserereterseeesseeeseeenseeeneee 161 

166 ETL 数据 质量 的 改进 e MM HH Hee 163 
16.6.1 EUER VALER 163 
16.6.2 ETL X38 E PHDSEDUJT HERI BL eee een enn nennen 163 
16.6.3 ”推动 ETL 数据 质量 改进 的 方法 eene ee eene 163 
1664 ETL 的 技术 路 线 选 择 nn 164 

167 ETL 应 用 举例 «e HH HH 165 
16.7.1 ETLI S 22 —————————— 165 
16.12 ETL 数据 源 说 明 en 166 
16.7.3 ODS 设计 与 抽取 ee】 166 
16.7.4 数据 仓库 (DW) WEBB eee ene eene 169 
16.7.5 ”数据 集 市 (DM) 设计 与 抽取 1 171 

16.8 本 章 小 结 "rr ——————— ——————————— OE Rh 173 


CE VER HEC Er iSc e a te AA 175 








17.1 OLAP IJ memes 175 
17.2 OLAP If] Scy emm emen eene 175 
17.2.1 Œ “AE” MIREA € 175 
VPE DEL LR 176 
17123 OLAP SSf&l] —ESER eee eneeeeneeeeennennrennennnnen nennen 178 

173 OLAP 的 应 用 实例 «ee M HMM mmm eee 179 
17.3.1 172 2 —————— 179 
VKPEME L2 ——————— 180 
17.3.3 GEMES ————————— 2€ 180 
17.34 WELL IE 181 

17.4 OLAP 系统 设计 的 一 般 步 骤 HMM HH eH 182 
IN US E E E 183 
E 18 章 应 用 举例 PN 185 
iu RS aea NE E E 185 
18.1.1 对 项 目 背景 与 目的 的 描述 nene eene nennen nnne nennen nnns 185 
18.1.2 fifi 2 EL SERES DI LER meme ene enne nennen 185 
18.1.3 ”制定 项 目 管理 文档 eeeeeeeeeteeereteeeerrereerteeeetseeeereteeerereeesereessereenseeeesseeessereessereesseeens 186 
18.1.4 项目 进度 划分 ee 187 

18.2 需求 分 析 2 188 
IFPAMERLA S. 2 ——— 188 
IP EPUM ————— 189 

18.3 营销 系统 设计 ————————— ———————— — 191 
ERBEN DI—————— 191 
18.3.2 ”营销 辅助 决策 系统 的 ETL 架构 设计 和 192 
18.3.3 ”营销 辅助 决策 系统 数据 访问 功能 设计 m MM 193 
183.4. 营销 辅助 决策 系统 展示 方式 设计 eme eee 193 
18.3.5 营销 辅助 决策 系统 主题 分 析 功 能 设计 mmm 194 
18.3.6 “数据 模型 设计 A 195 

184 ETL 数据 抽取 e HH eee 203 
IE REEL T2 DRE—————— € 203 
18.4.2 ”从 源 数 据 库 抽取 到 ODS 数据 缓冲 区 e e M MMMMMMMMMMMMRRMMMMRS 204 
184.8 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 RN 204 
1844 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 mmm Hem 205 
184.5. MJ E hh BUSCAR TE mmm eee een 205 

185 JEZÉHEZR e mee eene 206 
18.6 Sp E; MAU mH HH eee 206 
18.7 ”编写 用 户 手 册 MM HHHHHeHeHeHeHRHRHH 208 
18.8 软件 发 布 和 209 


XII 


189 IZI JAEP eee eene 209 








NINE SU Dl 210 

78 19 & KAGEL SES e Hee eee 211 
19.1 ABS BEXAS mmm Hee 211 

19.2. ”大 数据 的 处 理 技术 之 一 流 数 据 HMM HH) 212 

193. KAGE FIC ee M e HH Hem 212 

194. XAd&jdgE 8T ANM BI E SE e MH 213 

19.5 Ed "——————————— —————————————" 216 

第 20 音 金融 行业 的 商业 智能 概述 e HH Hee HHHHHeHHHH HH 217 
20.1 ”人 铭 融 行业 实施 商业 智能 的 背景 和 217 

H Tol RE | see ee be e eE 217 

203 ”金融 行业 实施 商业 智能 的 措施 mme HHHeHemHHHRBHÜeÁé 218 
PNEU ET E E 218 

第 21 音 电力 行业 商业 智能 概述 eH mH eH 219 
211 电力 行业 面临 的 挑战 和 219 
21.2 建设 企业 级 数据 仓库 的 原因 219 

213 ”电力 行业 数据 仓库 的 执行 架构 HMM MMMMHHHHHIHHHHIHRRRRHRHHMHMHMMHeReReRRHRIRHÁHeBeHeÜRIwI 220 
214 数据 仓库 开发 的 阶段 、 任 务 和 流程 mmm e Meme MHRRReHeÜRIewB 220 
21.5. Xie Fea VE V e HH HH HH 22] 
21.6 ”电力 行业 数据 仓库 的 建设 方法 MM MHHeHIHHMMBeHRIwR 221 
21.7 本 章 小 A DHT PX 224 

I R 篇 

第 22 音 Informatica PowerCenter 工具 简介 eeeeeeeeeeeeeeeeeeereeereerrerereeereeereeereeereeereeereeeee 225 
22.1 Informatica PowerCenter 介绍 «ee 225 
22.1.1 Informatica 的 特点 226 

22.12 Informatica 的 优势 226 

222 Informatica PowerCenter 1 HEU 297 
223 [Informatica Servers 5 | VE «e 227 
221. Adramisttatiot; Console esie testo dot esess ha ados nsa eoe tae e hee edet e pie pode e S 228 
224.1 登录 方式 和 229 

PEVER DL I—«««—— € 2 230 

22.5 PowerCenter Designer eene nene 230 
22.5.1 ZERE XA ——— 231 

22.5.2 THp eve 033 

22.5.3 EBA EEE——— 235 

22.5.4 工作 区 236 

22.5.5 na IR 2037 

22.6 Repository Manager: 09 


22 6.1 p: ———— ————— —————————————Á———————————ÁÁ(€ 238 


22.6.2 ——«€—€—«—«—«—-—-——»————————————— 239 
22.6.3 BP E——€—€—€—€«—€«—«—«—»——»——— 239 
22.6.4 工作 区 239 

22.7 Workflow Manager eene 240 
22.7.1 ZERE eeereeerererreerereerreeeereeeeerereersereerseeeesseeeereteerseeeersteeessteeeseeeessereesseeeesseeensereesseeens 240 
22.7.2 DHJE ———————— 2A] 
22.7.3 EH————————Á 242 
puFPNRWIO RE ——2 243 
22.7.5 nu qm ——Ó— m 243 

A MER Woko Monor e ILL LLL LLL LL 243 
p» ARM, ———— 244 
22.8.2 II ee 245 
22.8.3 属性 E ——————————————— 246 

22 9 ZI veh —————————— ——— ———————— P————— € ———— T 246 
第 23 章 Cognos 工具 简介 ——————ÁÁ—————MÁ——— — M 247 
23.1 Cognos 介绍 ————————————Á———MMÓ 247 
23.1.1 Cognos 的 历史 ee 247 
23.1.2 Cognos [Ig i eene 247 
23.1.3. Cognos 的 现状 入 248 

23.2 Cognos 工具 浏览 ———ÓÁ————————————— 248 
23.3 Cognos Configuration eene 249 
23.4 Cognos Connection: eene 250 
23.4.1 ZIJE —(«««——R 250 
23.4.2 EIRA E ———m 251 
2343 LBJGRLUBVER] emen ene eene nennen nenne enne 25] 

23.5 Query Studio «eene 25] 
23.6 Analysis Studio 介绍 €—————Ó——————————MMÓ E 256 
23.6.1 Analysis Studio HJA eene 257 
"ATE UL LII—€€M———€€€«—«—«—«—«««—«-«—«—«—«—«—«—u«4«-«-«-«-a«—^«aA—^R^A^A^R € 257 

23.7 Report Studio 介绍 —————————————————————— P 258 
23.7.1 Report Studio 的 组 成 nee 259 
23.7.2 UL —((A((A^—^—^«—«—«—«——«—«—«-««^«4«^4««A«—«A««AA^A^A€«—«4«—4«—4«—«—«—«—«—€€«€«2 262 

238 Event Studio 介绍 ———————Á————Ó———————— TS 264 
"ARAM: LILIEO————« m 264 
23.8.2 Task 介绍 eereeetttteretttereteeererereerseeeesseeeesseeeesereerseeeesseeeessteeesereerseeeesseeeesseeessereesseeens 265 

23.9 Framework Manager TENA TT 有 267 
23.9.1 HEAS XX ————— 268 
23.9.2 TAER EE (———— € 27] 


XIV 


23.10 Transformer JT ZB «n 274 


2 274 
23.10.2 Dimension Map" nennen 215 
NUR NER UI CLE 276 
Da Ponden C RM E E EC ME CEU 276 
人 276 
23.10.6 Signon mS 277 

23.11 Cognos PowerPlay ee 277 
a OE OO 278 
2 UN I = EE 280 
aT a A a 280 

2n E i E EE E E A E A E ER 280 














第 24 音 Informatica hj Z4 E ERR A] e 282 
24.1 Informatica PowerCenter If] QIE Z& «e 282 
24.1.1 3 00/7 qM —— 282 
uPEELS SU —€€€A€€«&«—€«€€^€««-«-«-—-»—————— S 283 

24.1.3 ZP IRRE I ——————————————— 291 

24.2 Informatica PowerCenter 工具 的 一 般 使 用 流程 295 
24.3 Informatica PowerCenter DUI A [ ]« 296 
?ERABBPUUI————————— 296 

24.3.2 SU LL BEMEEEE—— n 301 

24.3.3 定义 目标 数据 e eeetteerereeererereerreeeerseeeesseeeerereerseeeerseeeereeeesereersereesseeeesseeessereesseeees 306 

24.3.4 定义 映射 规则 ——«——— OXwef&z 306 

24.3.5 定义 工作 流 和 309 

24.3.6 “启动 工作 流程 和 316 

24.4 本 章 小 结 eene 317 
*825 Æ Informatica EPI e HH Hee 319 
25] Zea AEn mmm mme 319 
252 BSAP HEIN SEIJJ AA meme emmmHHRemmmmHHeHemmmIRemmHmHHeHe mH) 319 
"LPANR TI VE——A— 2€ 319 

25.2.2 全 历史 记录 324 

25.2.3 标记 位 方式 站 328 

25.2.4 时 间 戳 方式 站 333 

252.5 记录 最 新 记录 和 上 一 次 历史 PN 337 

25.3 本 章 小 结 NOR MR Md AA E E EA NET MMC c AMET Lic s eA T LUC LA FE EE ULM ARMED 34] 

第 26 4 Cognos 安装 与 快速 入 门 eene 342 
26.1] Cognos 8 HENE Henne 342 


26.2 


26.3 


26.4 


26.5 
第 27 章 
27.1 
27:2 
27.3 
27.4 
27 .5 
第 28 章 
28.1 


28.2 


28.3 
XVI 


26.1.1 Cognos HR AT ARWBBE Hee 342 

















26.1.2 Cognos Framework AE «eene 345 
26.1.3 Cognos Transformer XE «eene 347 
26.1.44 Cognos 语言 包 安装 eene 349 
26.1.5 Cognos PowerPlay 安装 354 
Cognos AT 1B RBS aS LAE HMM HH e emHmHmHeHHHMHHH eH 358 
262.1 创建 Oracle 数据 库 实 例 «eee eee enne 358 
2622 ”执行 建 表 室 间 和 创建 数据 库 用 户 的 脚本 m M M MMMMHHHHHHHMHHeÜHnnmRBMMBBÜeÜe 363 
26.2.3 Cognos SE AER enne 364 
26.2.4 Wi Cognos JA 364 
262.5 ”启动 Cognos JIKAeeneeeeeeenenenneeeneneeenennenneneeneenee 369 
Cognos 入 门 实 例 一 ee HM HH Henne 369 
26.3.1 (EJH Framework 建 模 «ee ene eee eene enne 321 
26.3.2 ”使 用 Report Studio 制作 报表 和 382 
26.3.3 ”查看 报表 389 
Cognos 入 门 实 例 A eee M HMM Henne 390 
26.4.1 使 用 Framework 建 模 eee 3090 
26.4.2 ”使 用 Transformer YIRE HEIER eee mH eene eene 393 
26.4.8 ”使 用 Analysis Studio 制作 多 维 报表 e M MMMMMMMMMMMMMMMRAMMMMRRRSeÉeál 405 
"AVE: X2 —Ó——n€ 408 
本 省 外交 409 
Cognos 实例 «HH mmm nnne 410 
Section JI X€ HJ JT Jg ee 410 
Conditional Style 报表 的 开发 413 
图 表 型 报表 的 开展 419 
Drill-Through JEEIJJT Aon e n n n m Hee 425 
ET TT ——— (0 434 
Cognos DEZA ok o E 435 
Cognos LA U ITT 435 
28.1.1 Cognos 应 用 防火 博 seen 435 
| APME-L mm 436 
28.1.3 HJA RERO 437 
" AWEBNEALTO———————— 438 
Cognos Ux TTT 439 
28.2.1 操作 系统 安全 技术 439 
28.22 网 络 安全 技术 44] 
"PEMEX LR 44] 
28.2.4 QA I ————(«—————A—Ó«««———————— 442 
Cognos 安全 实 跨 eeeeeteeerererreeeeererrrerereeeerreserreeeerrreeerteeetrresereeeeerreeerteeeerreeeeeeeeeeeeseeeeet 443 


28.3.1 创建 Cognos 2H. ff ff, ——Á—————————————————————Á—————Á———— 443 








2832 为 组 、 和 角色 添 加 用 户 成 员 eme ene eee nennen enne 446 
28.3.3 TE Framework 中 设置 包 的 访问 授权 eee ee ee enne enne 449 

284 本 章 小 结 ————— ————— — —— — M — n —Á —— ] 452 

第 29 章 Cognos 优化 454 
291 JE Cognos 8 HJ PARED SE IBS (TXR BE Oe 454 
292 ”提高 Cognos 8 If] Zi PEUT IR RE eem nn 455 
293 ”修改 Cognos 8 HJ reportservice.xml ZH 455 
204 ”修改 读 取 高 速 缓 存 的 值 以 提高 性 能 Mel 457 
20.5 ”开启 crosstab caching 提高 cube 的 访问 速 订 eee HH 458 
20.6 ” 读 取 数据 时 启用 多 CPU 处 理 和 PN 458 
29.7 减少 cube Zt BR ARUM 459 
298 本 章 小 结 ee E en ne ee 459 
附录 。 HORGRDL OALRBH-eeeeeeeeee 460 


XVII 


US P", 
理论 篇 
第 1 — pMEBIBEIRRIAF 


本 章 目标 
什么 是 商业 智和 
用 ? 或 者 说 商业 智能 











E? 什么 样 的 企业 需要 商业 智能 ”商业 智 
给 我 们 的 生活 市 来 了 哪些 便利 ? 下 面 先 了 解 吴 边 的 几 个 商业 
e 大 家 知道 ， 商 业 银 行 的 网 点 非常 多 ， 











He 
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在 这 些 企业 里 发 挥 了 怎样 的 重要 作 








每 家 网 点 的 现金 


入 能 应 用 的 例子 : 


F1 H6 


流 每 天 都 是 不 一 样 的， 那么 银行 








面临 的 问题 就 来 了 : 怎么 解决 或 者 平衡 各 网 点 的 现金 流 问 题 ? 
e 和 朱 友 电 企 业 如 何 根据 历史 发 电量 、 历 史 增 长 京 和 其 他 相关 的 因素 去 预测 未 来 几 年 的 用 


电 需 求 ? 











e 人 泉 人 连续 两 次 在 丽 方 航 容 公司 订 轮 系统 网 站 购买 大 连 和 青岛 到 北京 的 往返 机 时 ， 后 来 





一 年 ， 每 隔 一 


持续 








周 束 能 收 到 航空 公司 的 关于 三 亚 特 价 机 票 和 酒店 的 邮件 和 短信 提 











示 。 那 么 该 订 票 系统 如 何 根据 个 人 的 历史 订 票 记录 去 预测 未 来 哪些 潜在 客户 会 在 什么 
时 段 内 需要 预订 哪些 机 票 ? 





针对 以 上 问题 ， 本 曹 对 商 、 
性 和 作用 ， 并 且 预 测 了 商业 和 
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1.1 概述 


1.1.1 商业 智能 的 定义 
曾经 看 过 这 样 一 个 例子 ， 


业 智 能 做 了 概述 性 的 介 


业 智 能 的 核心 技术 。 
的 实施 方法 和 步骤 。 


组 织 机 构 的 特点 。 


美国 某 超市 有 一 个 系统 : 





， 重 点 讲解 了 丙 业 智能 在 企业 中 的 重 
能 的 一 NI 








当 你 采购 了 一 和 于 的 物品 准备 结账 时 ， 


1 





美丽 的 收银 员 小 姐 扫 完 了 你 的 所 有 物品 后 ， 半 算 机 会 显示 出 一 些 信息 ， 然 后 收银 员 小 姐 会 友 
好 地 问 你 :“ 我 们 有 一 种 一 次 性 纸杯 正在 促销 ， 位 于 XX 仙 架 上 ， 您 要 购买 么 ? ”结果 你 非 第 
惊奇 地 说 :“ 啊 ， 谢 谢 你 ! 我 刚才 一 直 没 有 找到 纸杯 。” 那 么 ， 计 算 机 系统 是 如 何 知 道 的 ? 秘 
密 在 于 当 系 统 知 道 你 的 购物 车 里 面 有 餐巾纸 、 大 瓶 可 乐 和 沙拉 的 时 候 ， 则 会 计算 出 有 80% 以 
上 的 概率 你 要 买 一 次 性 纸杯 。 这 就 是 商业 智能 的 一 个 重音 应用。 

再 举 一 个 例子 ， 智 能 手机 可 以 内 舱 全 球 卫 星 定 位 系统 ， 通 过 该 系统 ， 我 们 可 以 找到 最 近 
的 银行 网 点 ， 并 且 可 以 预约 排队 ， 同 时 银行 可 以 分 析 我 们 的 喜好 ， 回 我 们 推送 附近 刷卡 打折 
的 购物 信息 ， 我 们 可 以 圣 受 到 各 种 趣味 的 银行 服务 。 换 句 话 说 ， 银 行 可 以 利用 商业 智能 为 我 
们 提供 各 种 智能 化 和 个 性 化 的 服务 。 

当然 ， 商 业 智 能 的 作用 绝 不 仅 限 于 此 ， 从 小 型 的 超市 系统 ， 到 银行 、 航 空 、 水 利 、 电 
力 、 铁 路 运输 等 大 型 系统 ， 商 业 知 能 的 应 用 无 处 不 在 。 如 宋 我 们 对 丙 业 知 能 做 一 个 简单 的 
定义 ， 那 就 是 :帮助 你 把 一 些 数据 转化 成 具有 商业 价值 的 ， 而 且 可 以 获取 的 信息 和 知识 ， 
同时 在 最 恰当 的 时 候 ， 通 过 录 种 方式 把 信息 传递 给 需要 的 人 。 从 专业 的 角度 来 说 ， 丙 业 管 
能 就 是 利用 数据 仓库 、 数 据 分 析 和 挖掘 拉 术 ， 以 抽取 、 转 换 、 俘 询 、 分 析 和 预测 为 主 的 技术 
手段 ， 帮 助 企业 完成 决策 分 析 的 一 套 解决 方案 。 

在 上 面 的 例子 中 ， 计 算 机 系统 把 餐巾 纸 、 大 瓶 可 乐 、 沙 拉 等 商品 信息 转化 成 具有 商业 
价值 的 信息 《知识 )， 同 时 在 恰当 的 时 候 把 顾客 需要 一 次 性 纸杯 的 信息 告诉 收银 员 。 商 业 
智能 的 价值 体现 在 将 数据 转化 成 信息 和 知识 ， 最 后 转化 成 利润 。 如 图 1-1 所 示 。 
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图 1-1 商业 智能 的 价值 


很 多 企业 在 经 过 多 年 的 业务 系统 的 运行 之后 ， 已 经 拥有 了 大 量 的 经 营 数据 ， 那 么 如 何 将 











这 些 宝贵 的 数据 财 让 转化 成 信息 和 知识 传递 给 企业 管理 者 呢 ? 这 就 是 商业 智能 需要 研究 和 完 
成 的 工作 。 商 业 智 能 好 像 一 个 采矿 加 工场 ， 它 负责 采集 大 量 的 矿石 ， 然 后 经 过 进一步 的 分 离 、 
加 工 等 操作 ， 最 后 提 烁 出 高 纯度 的 精 矿 。 其 实 企业 经 营 和 管理 的 数据 瓯 是 这 些 “在 石 >， 而 商 
业 知 能 的 作用 就 是 将 这 些 “ 矿 石 ” 转 化 成 “ 精 矿 ”。 

商业 智能 对 企业 的 重要 性 是 不 译 而 喻 的 ， 它 可 以 提 电 企业 的 运营 效 京 ， 增 加 苋 搜 力 和 领 
导 决 策 能 力 ， 从 而 获得 更 大 的 市 场 ， 提 高 企业 的 利润 。 同 时 也 为 公司 的 管理 人 员 提 供 一 种 全 
狐 的 思维 方式 ， 通 过 使 用 这 些 宝 喧 的 数据 资产 进行 挖 气 和 分 析 ， 发 现 内 部 潜在 的 规律 和 趋势 ， 
这 样 才能 做 出 准确 的 判 师 ,制定 出 正确 的 决 集 方针 。 这 样 的 企业 在 苋 搜 中 才能 处 于 不 败 之 地 ， 
癌 时 也 优化 了 企业 内 部 组 织 结构 ， 增 强 了 企业 资源 的 合理 配置 。 
































1.1.2 ”商业 管 能 的 作用 


(1) 理解 业务 流程 和 发 展 趋势 

商业 智能 可 以 帮助 企业 人 员 深 入 理解 业务 流程 和 企业 的 发 展 趋势 。 

(2) 改善 企业 内 部 管理 

商业 智能 可 以 改善 企业 的 内 部 管理 ， 衡 量 员 工 的 绒 效 ， 帮 助 企 业 员 工 、 供 应 责 和 股东 了 
解 企 业 的 运营 状况 。 

(3) 提高 企业 的 利润 

企业 可 以 通过 商业 智能 获取 有 用 的 信息 ， 通 过 搜集 各 种 数据 ， 为 客户 提供 各 种 个 性 化 的 
服务 ， 提 高 客户 的 忠诚 度 ， 从 而 有 效 地 提高 了 企业 的 利润 。 
1.1.3 ”商业 智能 的 处 理 过 程 

商业 智能 的 主要 处 理 过 程 是 : 从 不 同 的 数据 源 中 收集 有 用 的 数据 ， 对 数据 进行 清理 ， 以 
保证 数据 的 一 致 性 和 准确 性 ， 然 后 ， 将 数据 进行 相应 的 转换 ， 再 加 载 到 数据 仓库 中 ;最 后 ， 
选择 合适 的 数据 挖掘 分 析 工 具 和 OLAP 工具 ， 将 数据 转化 成 信息 和 知识 ， 通 过 可 视 化 的 技术 
将 所 得 到 的 信息 、 知 识 呈 现 给 用 户 。 如 图 1-2 所 示 : 
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信息 查询 知识 发 现 和 预测 分 析 






OLAP 工 具 数据 挖掘 分 析 工 具 
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图 1-2 商业 智能 的 处 理 过 程 


1.1.4 商业 智能 的 功能 


商业 智能 最 早出 现在 20 世纪 90 年 代 ， 包 的 主要 功能 是 得 询 报表 、 数 据 分 机 、 数 据 备份 
和 恢复 等 ， 随 看 拉 术 的 发 展 和 应 用 的 拓展 ， 丙 业 智 能 已 经 扩展 了 其 他 的 功能 。 
(1) 数据 读 取 功能 。 除 了 读 取 结构 化 数据 ， 商 业 智 能 还 可 以 读 取 非 结 构 化 数据 和 半 结 构 
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化 数据 。 

(2) 报表 展示 的 功能 。 例 如 利用 报表 工具 (Cognos、BO 等 ) 的 可 视 化 功能 将 数据 呈现 给 用 
F, NUES: ANRE WE MAR RE ESE, ERE Guk 1-3)。 还 可 以 通 
过 问 下 锁 取 ， 数 据 切 片 和 旋转 以 及 交互 式 的 图 形 分 析 能 力 ， 使 用 户 能 够 从 任何 角度 去 观察 业务 。 
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Ist Otr 
图 1-3 柱状 图 


G) 数据 分 析 挖 掘 功能: 通过 业务 之 间 的 关联 关系 去 探查 事物 发 生 的 概率 。 

(4) 知识 发 现 的 功能 : 知识 发 现 是 从 大 量 的 数据 中 提取 人 们 感 兴 趣 的 知识 的 能 力 ， 这 些 
知识 可 以 是 隐 仿 的、 事先 未 知 的 或 者 潜在 有 用 的 信息 ， 提 取 的 知识 表示 为 概念 、 规 则 、 规 律 
和 模式 等 形式 。 

(5) 红色 预警 功能 : 可 以 基于 数据 仓库 提供 预警 的 功能 。 

(6) 数据 管理 的 功能 : 管理 功能 是 从 多 个 数据 源 抽取 、 转 换 和 加 载 ， 以 及 清理 和 集成 数 
据 的 能 力 ， 包 括 高 效 存储 与 维护 的 能 


1.1.5 商业 智能 的 发 展 趋势 


随 看 互联 网 的 普及 和 拉 术 的 进步 ， 商 业 智能 的 发 展 也 成 了 不 可 阻挡 的 趋势 。 企 业 可 以 通 
过 互联 网 信息 的 收集 ， 获 取 更 多 的 客户 信息 和 交易 信息 ， 再 通过 商业 智能 技术 的 应 用 ， 将 这 
些 数 据 转 化 成 更 有 价值 的 信息 ， 帮 助 企 业 高 层 做 出 准确 的 分 析 和 决策 。 

商业 智能 除了 帮助 企业 省 理 人 员 做 出 准确 的 分 析 和 决策 ， 还 可 以 为 客 记 提供 各 种 个 性 化 的 
服务 。 例 如 通过 客户 的 特征 和 以 往 的 交易 情况 ， 分 析出 客户 的 购买 力 和 喜好 ， 从 而 进行 有 针对 
性 的 营销 。 这 不 仅 可 以 给 商家 带 来 下 接 的 经 济 利益 ， 同 时 也 可 以 帮助 客户 在 最 短 的 时 间 内 购买 
到 最 需要 的 商品 。 商 业 智 能 的 发 展 也 必然 通过 Web 和 局 域 网 的 交互 ， 实 现 信息 和 知识 的 共享 。 

日前 随 看 商业 智能 拉 术 的 发 展 ， 对 非 结构 化 数据 的 处 理 能 力 显 戎 增强 了 。 以 前 ， 商 业 管 
能 处 理 的 数据 主要 以 结构 化 的 信息 为 主 ， 也 束 是 存储 在 内 部 数据 库 中 的 数据 和 文本 。 而 现在 ， 
越 来 越 多 的 企业 已 经 将 各 种 非 结构 化 数据 当做 主要 的 数据 源 ， 例 如 各 种 客户 的 呼叫 记录 、 影 
像 资 料 、 音 频 资料 、 文 本 、 图 片 和 各 种 电子 邮件 等 。 

移动 互联 网 的 发 展 ， 大 大 提高 了 商业 智能 对 金融 数据 的 收集 能 力 ， 包 括 用 户 的 交易 数据 
和 行为 数据 。 金 融 服务 的 多 样 化 和 市 场 规模 的 不 断 扩 大 ， 需 要 对 这 些 数 据 进行 深度 挖 据 和 分 
析 ， 匹 配 金 融 产 品 的 交易 需求 ， 发 现 隐藏 的 趋势 信息 ， 玫 助 金融 机 构 发 现 商 机 。 

中 国 是 发 展 最 快 的 新 兴 经 济 体 ， 国 内 外 很 多 经 济 学 家 都 预测 中 国 未 来 有 可 能 成 为 世界 的 



































































































































经 济 中 心 忆 一。 为 了 实现 这 个 目标 ， 中 国 很 多 制造 、 能 源 企 业 必 将 大 力 发 展商 业 智 能 技术 ， 
加 大 对 商业 智能 解决 方案 的 投入 ， 从 而 降低 生产 成 本 ， 提 高 资源 利用 率 和 市 场 占有 率 ， 使 其 
生产 运营 能 够 更 加 健康 平稳 的 发 展 。 


12. 关于 商业 智能 的 核心 技术 


构建 一 个 完整 的 商业 智能 系统 需要 以 下 几 种 核心 的 技术 : 
1.2.1 ”数据 仓库 


“数据 仓库 之 父 ”William H.Inmon 在 《Building the Data Warehouse》 一 书 中 给 出 的 定义 : 
“数据 仓库 是 在 企业 管 理 和 决 全 中 和 面 问 主题 的 、 集 成 的 、 时 变 的 、 非 易 失 的 (不 可 修改 的 ) 数 
据 集合 ”。 实质 上 ， 数 据 仓 库 是 对 数据 处 理 技术 的 集成 ， 它 是 为 了 进一步 挖掘 数据 资源 ， 为 了 
决策 分 析 而 产生 的 。 建 立 数据 仓库 的 目的 是 为 了 前 问 报 表 码 询 和 决策 分 析 。 


1.2.2 ”数据 挖掘 和 分析 


数据 挖 据 和 分 析 主 要 用 于 从 大 量 的 数据 中 发 现 背 后 隐藏 的 规律 和 数据 间 的 关系 。 采 用 数 
据 控 据 技 术 ， 可 以 为 用 户 提 供 目 动 化 和 智能 的 辅助 决 案 分 析 。 特 别 是 在 金融 行业 、 零 售 业 和 
医疗 卫生 领域 都 有 大 量 的 应 用 。 

在 数据 挖掘 技术 中 各 用 的 模型 有 : 

(1) 分 类 模型 : 根据 商业 数据 的 属性 将 数据 分 配 到 不 同 的 组 中 。 

(20 关联 模型 : 主要 描述 一 组 数据 项 目的 密切 度 和 关系 。 

G) 顺序 模型 : 主要 用 于 汇总 数据 中 的 第 见 顺 序 或 事件 。 顺 序 模型 可 以 看 成 是 一 种 特 
殊 的 关联 模型 ， 它 在 关联 模型 中 增加 了 时 间 属 性 。 

(4) 聚 刻 模型 :按照 条 种 相近 程度 将 数据 分 成 一 些 组 。 组 中 的 数据 相近 ， 组 之 间 的 数据 
ERK o 


1.2.3 ETL 处 理 技术 


ETL 即 数 据 抽 取 (Extract)、 转 换 (Transform)、 装 载 (Load) 的 过 程 。 它 是 构建 数据 仓 
库 系 统 的 关键 环节 。 因 为 数据 仓库 主要 存储 面 问 主题 的 、 集 成 的 、 稳 定 的 并 且 随 时 间 不 断 变 
化 的 数据 集合 ， 所 以 数据 在 进入 到 仓库 之 前 ， 需 要 经 过 清洗 、 转 化 的 过 程 ， 以 保证 数据 仓库 
中 的 数据 是 准确 的 。 
1.2.4 ”联机 分 析 处 理 (OLAP ) 技术 

联机 分 析 处 理 技术 主要 通过 多 维 的 方式 对 数据 进行 分 析 、 查 询 和 报表 人 处理 。 这 种 决策 分 
析 是 基于 多 维 的 和 历史 的 ， 我 们 把 它 称 之 为 联机 分 析 处 理 。 
1.2.s 可视化 分 析 


可 视 化 分 析 是 将 数据 转化 成 用 户 更 易 理解 和 接受 的 方式 ， 例 如 各 种 图 表 ， 使 数据 的 展示 
方式 更 加 形象 、 志 观 、 可 视 化 分 析 将 会 给 人 机 交互 融 来 全 新 的 车 命 。 















































1.2.6 ”大 数据 技术 


壹 肯 锡 在 研究 报告 中 指出 ， 数 据 已 经 渗入 到 每 个 行业 和 各 个 领域 当中 ， 人 们 逐渐 重视 对 
海量 数据 的 运用 ， 因 为 互联 网 、 移 动 互联 网 、 物 联网 和 云 计 算 的 快速 普及 ， 使 得 当前 数据 的 
增长 比 历史 上 任何 时 期 都 要 快 。 

大 数据 是 一 个 涵盖 多 种 技术 的 概念 ， 简 单 地 说 ， 就 是 从 各 种 类 型 的 数据 中 ， 人 快速 获得 价 
值 的 能 

IBM 将 “大 数据 ”理念 定义 为 4 个 V, 即 数 量 (Volume)、 多 样 性 (Variety)、 速度 (Velocity ) 
及 价值 密度 (Value)。 

WE (Volume): 是 指数 据 量 的 巨大 。 

多 样 性 (Variety): 主要 包括 结构 化 数据 、 半 结构 化 数据 和 非 结 构 化 数据 。 

(OD 结构 化 数据 : 主要 存在 于 关系 数据 库 中 。 

(20 半 结 构 化 数据 : 包括 电子 邮件 、 文 学 处 理 文件 以 及 大 量 友 布 在 网 络 上 的 狐 闻 等 。 

(3) 非 结 构 化 数据 : 广泛 存在 于 社交 网 络 、HTML、 报 表 、 物 联网 、 电 子 商 务 之 中 。 随 
看 移动 计算 和 传感器 等 独 技 术 的 发 展 ， 超 过 80% 的 数据 属于 非 结构 化 数据 。 

速度 (Velocity): 实时 获取 需要 的 信息 。 

价值 密度 (Value): 对 于 大 数据 来 说 ， 数 据 的 价值 密度 低 ， 以 视频 为 例 ， 在 连续 不 间断 
的 监控 过 程 中 ， 有 用 的 数据 仅仅 只 有 一 两 秒 。 通 过 算法 完成 数据 价值 的 “提取 ” 是 以 沙里 淘 


金 的 过 程 。 
1.2.7 ”商业 智能 元 数据 管理 


元 数据 管理 是 整个 商业 智能 系统 中 最 重要 的 环节 ， 元 数据 管理 贯穿 于 商业 智能 系统 数据 
“流动 ”的 全 过 程 ， 主 要 包括 : 数据 源 元 数据 、 采 集 元 数据 、 数 据 仓 库 元 数据 、 数 据 集 市 元 数 
据 、 应 用 服务 层 元 数据 等 。 

元 数据 的 分 类 主要 包括 : 业务 元 数据 、 技 术 元 数据 和 管理 元 数据 。 

A) 业务 元 数据 : 

业务 元 数据 可 以 分 成 业务 规则 、 业 务 指标 、 业 务 描述 和 业务 术语 等 四 个 部 分 。 这 四 个 部 
分 共同 完成 对 业务 信息 的 表述 。 

(2) 技术 元 数据 

技术 元 数据 包含 关于 商业 智能 系统 技术 层面 的 信息 ,描述 了 数据 源 接口 、ETL 映射 关系 、 
数据 仓库 和 数据 集 市 等 系统 的 特征 。 

(3) 管理 元 数据 

管理 元 数据 主要 是 指 商 业 智 能 系统 日 党 建设 过 程 中 ， 涉 及 开发 、 运 维 管理 各 方面 的 基本 
言 上 号 ， 在 此 基础 上 对 系统 需求 开发 和 日 常 运 维 管理 提供 文 撑 。 
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1.3.4. 商业 智能 的 实施 方法 


(1) 项 目 规 划 : 主要 包括 项 目前 期 的 准备 、 业 务 现状 的 调研 以 及 目前 系统 的 现状 分 析 。 
分 析 内 容 包括 业务 需求 的 定义 、 系 统 实现 的 目标 、 系 统 运 行 环境 的 定义 、 系 统 的 框架 结构 定 
义 、 逻 辑 模型 的 设计 等 。 

(2) 系统 设计 与 实现 : 主要 包括 系统 体系 结构 的 设计 、 物 理 数据 库 的 设计 、 数 据 抽取 / 转 
换 / 加 载 的 实现 、 前 站 应 用 的 开发 、 元 数据 的 管理 等 内 容 。 

(3) 系统 调 优 : 指 旬 辑 、 物 理 模型 的 调整 和 系统 性 能 的 调 优 。 

(4) 系统 运行 维护 : 指 编写 系统 运行 维护 手册 、 用 户 操作 手册 、 项 训 教材 等 文档 。 


1.3.2 ”商业 智能 的 实施 步骤 


(1) 定义 需求 

需求 分 析 是 商业 智能 项 目 最 重要 的 一 步 ， 需 要 描述 项 目 背 景 与 目的 、 业 务 范围 、 业 务 目 
标 、 业 务 需 求 和 功能 需求 等 内 容 ， 明 确 企 业 对 商业 智能 的 期 望 和 需要 分 析 哪 些 主题 等 方面 。 
其 中 项 目 背 景 主 要 描述 已 有 系统 的 当前 现状 ， 包 括 不 同 的 历史 时 期 ， 它 的 业务 需求 分 别 是 什 
么 。 这 些 独 立 的 信息 系统 特点 一 般 是 缺乏 统一 的 整体 规划 和 标准 ， 数 据 分 散 ， 每 个 业务 之 间 
不 能 共享 信息 ， 报 表 展 示 功 能 单一 ， 各 业务 系统 之 间 存 在 数据 不 一 致 的 现象 ， 导 致 企业 领导 
层 无 法 从 全 局 的 角度 对 业务 进行 综合 分 析 。 

丙 业 智能 项 目 最 重要 的 目的 是 解决 各 个 业务 系统 之 间 数 据 集中 整合 的 问题 ， 为 企业 管理 
人 员 提 供 高 效 的 数据 查询 和 强大 的 报表 展示 功能 ， 同 时 能 够 进行 多 维度 的 深入 分 析 和 数据 挖 
据 ， 为 企业 未 来 的 经 营 状况 作出 准确 的 预测 。 

业务 范围 是 对 项 目 团队 所 有 人 员工 作 范 围 的 界定 。 

业务 需求 是 描述 客户 对 于 系统 实现 的 总 体 性 要 求 ， 商 业 智能 项 目的 特点 是 从 不 同 的 维度 
去 分 析 各 个 主题 ， 以 报表 的 形式 对 业务 进行 前述 。 

功能 需求 可 以 包含 : 各 个 业务 专题 分 析 、 关 键 性 指标 查询 和 监控 、 报 表 查 询 、 高 级 分 析 
和 数据 挖掘 等 内 容 。 

商业 智能 的 功能 框架 如 图 1-4 所 示 : 
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(2) 数据 仓库 模型 的 建设 

模型 是 对 现实 世界 的 抽象 。 数 据 仓库 模型 是 在 需求 分 析 的 基础 上 建立 起 来 的 。 数 据 模型 的 
设计 流程 是 : 在 系统 设计 、 开 发 之 前 ， 业 务 人 员 和 设计 人 员 共 同 参 与 概念 模型 的 设计 ， 核 心 的 
业务 概念 需要 在 业务 人 员 和 设计 人 员 之 间 达 成 一 致 ， 在 系统 设计 开发 时 ， 业 务 人 员 和 系统 设计 
人 员 共 同 参 与 逻辑 模型 的 设计 ; 最 后 设计 开发 人 员 以 逻辑 模型 为 基础 进行 物理 模型 的 设计 。 

(3) 数据 抽取 、 清 洗 、 转 换 、 加 载 (ETL) 

抽取 主要 负责 将 数据 仓库 需要 的 数据 从 各 个 业务 系统 中 抽取 出 来 。 如 果 每 个 业务 系统 的 
数据 情况 各 不 相同 ， 可 能 对 每 个 数据 源 都 需要 建立 独立 的 抽取 流程 ， 每 个 流程 都 需要 使 用 接 
口 将 源 数据 传送 给 下 一 阶段 的 清洗 与 转换 阶段 。 通 过 数据 抽取 程序 ， 可 以 从 业务 源 系统 中 不 
靳 地 将 数据 抽取 出 来 ， 抽 取 周 期 可 以 设 定 为 某 个 固定 时 间 ， 例 如 每 天 中 午 12 点 对 源 数据 进行 
抽取 ， 也 可 以 设 定 为 某 个 时 间 间 隔 ， 例 如 每 6 个 小 时 抽取 一 次 源 数据 。 

清洗 阶段 是 对 业务 源 数 据 的 清洗 和 确认 ， 检 和 碍 抽取 的 源 数据 质量 是 否 达 到 数据 仓库 的 规 
定 标准 。 数 据 清洗 大 致 有 两 种 方式 。 一 是 不 同业 务 系统 间 各 上 自 专用 的 清洗 程序 ， 二 是 不 同业 
务 系统 间 有 满足 数据 仓库 清洗 需求 的 通用 程序 。 从 不 同业 务 系统 抽取 的 数据 有 可 能 存在 数据 
不 一 致 的 情况 ， 这 时 可 以 使 用 相关 规则 和 标准 检查 业务 源 数 据 的 质量 。 

转换 是 对 源 系统 的 数据 做 最 后 一 步 的 修改 ， 包 括 对 源 数 据 的 聚合 以 及 各 种 计算 ， 是 整个 
ETL 过 程 的 核心 部 分 。 

加 载 是 将 数据 加 载 到 最 后 的 目标 表 中 ， 其 复 琳 度 没 有 转换 高 ， 一般 采 用 批量 装载 的 形式 。 

(4) 建立 商业 智能 分 析 报 表 

商业 智能 分 析 报 表 通 过 对 数据 仓库 的 数据 分 析 ， 使 企业 的 高 层 领 导 可 以 从 多 个 角度 查看 
企业 的 运营 情况 ， 并 且 按 照 不 同 的 方式 去 探查 企业 内 部 的 核心 数据 ， 从 而 更 好 地 帮助 企业 决 
策 人 员 对 公司 未 来 经 营 状 况 进 行 预 测 和 判断 。 


14 商业 智能 项 目 成 功 的 关键 


1) 企业 高 级 领导 层 对 商业 智能 项 目的 文 持 和 充足 的 资金 投入 是 项 目 成 功 的 关键 之 一 。 

2) 实力 雄厚 的 拉 术 团队 不 仅 精 通商 业 智能 相关 技术 ， 同 时 也 邵 悉 相关 的 业务 规则 和 开 友 
流程 ， 也 是 项 目 成 功 的 重要 保障 。 

3) 商业 智能 项 目 团队 的 协同 合作 能 力 。 项 目的 管理 者 需要 保证 团队 中 每 个 人 员 的 分 工 明 
傅 ， 沟 通 及 时 ， 并 且 需 要 各 部 门 乙 间 有 民 好 的 合作 能 力 。 总 之 ， 商 业 智 能 项 目的 实施 是 一 个 
长 期 的 不 断 完善 的 过 程 。 



















































































1.5 商业 智能 项 目的 组 织 机 构 


(1) 商业 智能 项 目 甲 方 组 织 机 构 

一 般 来 说 ， 甲 方 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 业 务 负 下 人 、 业 务 系统 负 贡 人 、 
业务 部 门 代表 、 业 务 系统 开发 商 代表 、 软 便 件 平台 供应 商 ， 如 图 1-5 所 示 。 

(2) 商业 智能 项 目 乙 方 开发 商 组 织 机 构 

商业 智能 项 目 乙 方 开发 商 组 织 机构 应 该 包括 以 下 成 员 : MEHA, KENAN AF 





需求 调研 人 员 和 需求 分 析 人 员 )、 设 计 人 员 (包括 架构 设计 人 员 、 模 型 设计 人 员 、ETL 设计 人 
员 、 报 表 设 计 人 员 )、 开 发 人 员 (包括 ETL 数据 抽取 开发 人 员 、 报 表 开 发 人 员 )、 测 试 人 员 、 
WEKA, WK 1-6 所 示 。 





业务 部 门 代表 | | 业务 系统 开发 商 代表 | | 软 硬 件 平台 供应 商 


图 1-5 甲 方 组 织 机 构 


架构 设计 人 员 | | 模型 设计 人 员 


图 1-6 乙方 开发 组 织 机 构 








1.6 本 章 小 结 





D 商业 智能 对 企业 的 重要 性 是 不 言 而 喻 的 ， 它 可 以 提高 企业 的 运营 效率 ， 增 加 企业 的 壳 
争 力 和 领导 者 的 决策 能 力 ， 从 而 获得 更 大 的 市 场 ， 提 高 企业 的 利润 。 
2) 随 看 商业 智能 的 友 展 ， 除 了 基本 的 功能 外 ， 还 扩展 了 读 取 数据 的 功能 、 分 析 功 能 和 报 
表 展 示 的 功能 。 
3) 商业 智能 拓展 的 功能 。 
e ZRADE: 际 了 读 取 结构 化 数据 外 ， 还 包括 非 结 构 化 数据 和 半 结 构 化 数据 。 
e 数据 分 析 控 抉 功 能 :通过 业务 之 间 的 关联 关系 ， 去 探 全 事物 发 生 的 概率 。 
e 知识 友 现 的 功能 :知识 发 现 是 从 大 量 的 数据 中 提取 人 们 感 兴趣 的 知识 的 能 力 ， 这 些 知 
识 可 以 是 隐 舍 的 、 事 先 未 知 的 或 者 潜在 有 用 的 信息 ， 提 取 的 知识 表示 为 概念 、 规 则 、 
规律 和 模式 等 形式 。 
e 红色 报警 功能 : 可 以 基于 数据 仓库 提供 预警 的 功能 。 
e 报表 展示 的 功能 : 例如 利用 报表 工具 (Cognos. BO 等 ) 的 可 视 化 功能 将 数据 呈现 给 
用 户 ， 呈 现 的 形式 包括 : XRK. DPA. Hou. KI. AAR ÆR. aA 
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通过 癌 下 锁 取 、 数 据 切 片 和 旋转 以 及 交互 式 的 图 形 分 析 能 力 ， 使 用 户 能 够 从 任何 角度 
EMRS- 
4) 随 看 互联 网 的 发 展 ， 丙 业 知 能 的 应 用 越 来 越 广泛 ， 政 府 机 构 和 企业 必 将 加 大 对 商业 智 











能 的 投资 。 


5) 构建 一 个 完整 的 商业 智能 系统 需要 以 下 儿 种 核心 的 技术 : 数据 仓库 、 数 据 挖 据 和 分 





析 、ETL 处 理 技 术 、 联 机 分 析 处 理 COLAPO 技术 、 可 视 化 分 析 、 大 数据 技术 和 商业 智能 元 
数据 管理 。 


载 ， 


日 ， 


As 








60 商业 智能 的 实施 方法 包括 : 定义 需求 、 数 据 仓 库 模 型 的 建议 、 数 据 抽 取 / 请 洗 /转化 /加 
建立 商业 智能 的 分 析 报 表 。 

7) 数据 仓库 是 商业 智能 的 基础 平台 ， 是 商业 智能 的 核心 。 

8) ETL 是 数据 抽取 (Extract)、 转 换 (Transform)、 加 载 (Load) 的 简写 ， 贯 穿 于 整个 项 
关系 到 整个 项 目的 数据 质量 ， 所 以 必须 摆 放 到 十 分 重要 的 位 置 上 。 

9) 一 般 来 说 ， 甲 方 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 业 务 负 责 人 、 业 务 系统 负责 
业务 部 门 代 表 、 业 务 系 统 开 发 商 代 表 、 软 硬件 平台 供应 商 。 

100 商业 智能 项 目 乙 方 开发 商 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 需 求 定 义 人 员 E 


DE 





D 














括 需 求 调研 人 员 和 需求 分 析 人 员 )、 设 计 人 员 (包括 架构 设计 人 员 、 模 型 设计 人 员 、ETL 设计 
人 员 、 报 表 设计 人 员 )、 开 发 人 员 (包括 ETL 数据 抽取 开发 人 员 、 报 表 开 发 人 员 )、 测 试 人 员 、 
部 署 实施 人 员 。 
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第 2 草 数据 仓库 的 理论 知识 


本 章 目标 

通过 第 1 章 的 和 学习， 想必 该 者 已 经 大 致 了 解 了 商业 智能 的 概念 。 本 章 开 始 正 式 学 习 在 商 
业 智 能 中 占有 重要 地 位 的 数据 仓库 方面 的 知识 ， 使 谈 者 了 解数 据 仓库 的 特点 、 设 计 方 法 和 实 
施 的 方法 等 。 

学 习 本 章 后 ， 您 将 掌握 : 

e 数据 仓库 的 定义 。 

e 数据 仓库 的 特点 。 

e 数据 仓库 的 优势 。 

e 数据 仓库 和 数据 库 的 区 别 。 

@ 数据 仓库 的 使 用 和 维护 。 

@ 数据 仓库 的 组 成 部 分 。 

@ 数据 仓库 的 模型 设计 。 

@ 数据 集 市 的 概念 。 

e ODS 的 概念 。 

e 数据 集 市 和 数据 仓库 之 间 的 关系 。 

e 数据 仓库 项 目 开 发 的 一 般 流 程 。 


2.1 数据 仓库 概述 

















2.1.1 数据 仓库 产生 的 背景 


随 腹 数据 库 技 术 和 管理 系统 的 不 断 发 展 和 普及 ， 人 们 已 不 再 满足 于 一 般 的 业务 处 理 。 同 
时 随 看 数据 量 的 不 断 增 大 ， 如 何 能 够 更 好 地 利用 数据 ， 将 数据 转化 成 商业 价值 ， 已 经 成 为 人 
们 越 来 越 天 心 的 问题 。 举 例 来 说 ， 数 据 库 系统 可 以 很 好 地 解决 事务 处 理 ， 实 现 对 数据 的 “ 增 
删改 合 ” 等 功能 ， 但 古 却 不 能 提供 很 好 的 决策 分 析 支 持 。 因 为 事务 处 理 肯 和 完 考虑 响应 的 及 时 
性 ， 多 数 情 况 部 是 在 处 理 当 前 数据 ， 而 决 集 分 析 需 要 考虑 的 是 数据 的 集成 性 和 历史 性 ， 可 能 
对 分 析 处 理 的 时 效 性 要 求 不 局 。 所 以 为 了 提 融 决策 分 析 的 有 效 性 和 完整 性 ， 人 人 们 逐渐 将 一 部 
分 或 者 大 部 分 数据 从 联机 事物 处 理 系 统 中 剥离 出 来 ， 形 成 今天 的 数据 仓库 系统 。 


24.0. Zu EX 


数据 仓库 是 一 个 面向 主题 的 、 集 成 的 、 稳 定 的 、 历 史 的 、 随 看 时 间 的 流逝 发 生变 化 的 数 
据 集 合 ， 它 主要 用 来 文 持 企 业 管 理 人 员 的 决策 分 析 。 

面向 主题 的 特性 是 根据 业务 的 不 同 而 进行 的 内 容 划 分 。 集 成 特性 是 因为 不 同 的 业务 源 数 
据 上 共有 不 同 的 数据 特点 ， 当 业务 源 数 据 进 入 到 数据 仓库 时 ， 需 要 采用 统一 的 编码 格式 进行 数 
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据 加 载 ， 从 而 保证 数据 仓库 中 数据 的 唯一 性 。 稳 定性 是 指数 据 仓 库 通 第 保存 数据 不 同 历 史 时 
期 的 各 种 状态 ， 并 不 对 数据 进行 任何 更 新 操作 。 历 史 特 性 则 是 指数 据 你 留 时 间 戳 字段 ， 记 录 
每 个 数据 在 不 同时 间 点 内 的 各 种 状态 。 


2.4.3. 数据 仓库 和 商业 智能 之 问 的 关系 


从 图 2-1 我 们 可 以 看 出 ， 数 据 仓 库 是 商业 智能 的 基础 平台 ， 如 宋 没 有 数据 仓库 的 搭建 ， 
商业 智能 是 无 法 实现 的 。 














E 之 则 的 关系 


2.2 ”数据 仓库 的 特 扣 


2.1.2 市 归纳 了 数据 仓库 的 特点 : 

e HERH. 

e 集成 的 。 

e 稳定 性 。 

e 反映 历史 变化 。 

数据 仓库 的 特点 如 图 2-2 所 示 。 

下 面 将 分 别 介 绍 数据 仓库 的 这 些 特点 。 


2.2.1 面 癌 主题 


普通 的 操作 型 数据 库 主要 是 面向 事务 性 处 理 ， 而 数据 仓库 中 的 所 有 数据 一 般 按照 主题 进 
行 划 分 。 主 题 是 对 业务 数据 的 一 种 抽象 ， 是 从 较 融 层次 上 对 信息 系统 中 的 数据 进行 归纳 和 整 
理 。 向 向 主题 的 数据 组 织 可 以 分 成 两 部 分 根据 业务 数据 的 特点 进行 主题 的 抽取 和 确定 每 个 
主题 所 包含 的 数据 内 容 ， 典 型 的 主题 包括 : 客户 主题 、 产 品 主题 、 财 务 主题 等 ， 而 客户 主题 
包括 : 客户 基本 信息 、 客 户 信 用 信息 、 客 性 资产 信息 等 。 在 分 析 数 据 仓 库 主 题 时 ， 一 般 的 方 
法 是 移 确 定 几 个 基本 的 主题 ， 然 后 将 范围 扩大 ， 最 后 再 逐步 求 精 。 


I2 




















反映 历史 变化 


集成 的 








图 2-2 数据 仓库 的 特 氮 


2.2.2 SENE 


数据 仓库 中 的 数据 是 按照 主题 存储 的 ， 与 业务 系统 中 的 数据 可 能 会 存在 较 大 差别 。 数 据 
仓库 的 数据 来 源 于 不 同 的 业务 系统 ， 所 以 在 进入 到 数据 仓库 之 前 ， 需 要 经 历 一 个 整合 、 清 洗 
的 过 程 ， 以 保证 数据 的 一 致 性 ， 同 时 进行 数据 的 集成 、 计 算 和 汇总 。 

数据 仓库 在 经 历数 据 的 集成 阶段 后 ， 使 数据 都 遵循 统一 的 编码 规则 ， 并 且 消 除 许 多 元 余 
数据 。 

集成 一 般 有 两 种 形式 : 

(1) 数据 的 集成 ， 当 数据 从 数据 源流 癌 数据 仓库 时 ， 数 据 会 被 集成 。 

(2) 编码 的 集成 : 数据 仓库 是 从 分 黎 的 源 系 统 抽 取出 来 时 ， 为 了 消除 编码 的 不 一 致 性 ， 
需要 将 这 些 来 日 不 同 数据 源 的 编码 集成 起 来 ， 使 之 遵循 统一 的 编码 规则 。 


2.2.3 ”稳定 性 


数据 仓库 中 的 数据 反映 的 都 是 一 段 历 史 时 期 的 数据 内 容 ， 它 的 主要 操作 是 人 查询、 分 析 而 
不 进行 一 般 意 义 上 的 更 新 。 一 旦 某 个 数据 进入 到 数据 仓库 后 ， 一 般 情况 下 数据 会 被 长 期 保留 ， 
当 超 过 规定 的 期 限时 ， 才 会 被 归档 或 者 删除 。 通 常数 据 仓 库 需 要 做 的 工作 就 是 加 载 、 查 询 和 
分 析 ， 一 般 不 进行 任何 修改 操作 ， 因 为 这 是 为 了 企业 高 层 人 员 决 策 分 析 之 用 的 。 

同时 我 们 要 清楚 ， 数 据 仓 库 的 建设 需要 大 量 的 业务 数据 作为 积 昧 ， 而 将 这 些 宇 喧 的 历史 
信息 经 过 加 工 、 整 理 、 控 据 和 分 析 ， 最 后 提供 给 决策 分 析 人 员 ， 这 是 数据 仓库 建设 的 根本 日 
的 。 因 为 数据 仓库 只 进行 数据 查询 的 操作 ， 而 且 查 询 量 很 大 ， 所 以 对 数据 查询 的 效率 提出 了 
更 高 的 要 求 ， 例 如 可 以 利用 索引 、 分 区 等 技术 对 数据 仓库 进行 优化 。 
2.2.4 反映 历史 变化 

操作 型 数据 库 主要 反映 某 一 时 间 段 内 的 数据 ， 数 据 仓库 的 目标 就 是 对 企业 的 发 展 趋 势 作 
出 分 析 和 了 预测。 数据 仓库 不 断 从 OLTP 数据 库 中 获得 变化 的 数据 ， 从 而 形成 分 析 和 预测 需要 


的 历史 数据 ， 所 以 一 般 数 据 仓 库 中 数据 表 的 键 人 码 都 含有 时 间 项 ， 以 标明 数据 的 历史 时 期 信息 ， 
通过 对 这 些 历 史 数 据 的 挖 据 和 分 析 ， 可 以 对 企业 的 发 展 历 程 和 趋势 作出 分 析 预 测 。 
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数据 仓库 反映 历史 变化 表现 在 以 下 儿 个 方面 : 

(1) 数据 仓库 不 断 捕 捉 业 务 系统 中 已 经 变化 的 数据 ， 然 后 将 这 些 数据 追加 到 数据 仓库 中 ， 
将 不 断 生成 的 业务 快照 经 过 统一 集成 后 输入 到 数据 仓库 中 ， 对 于 捕捉 到 的 新 的 变化 数据 只 进 
行 新 增 操 作 ， 而 不 进行 更 新 操作 。 

(2) 一 般 来 说 ， 数 据 仓 库 的 数据 会 有 存储 期 限 ， 一 旦 超出 了 期 限 ， 过 期 数据 就 会 锌 归档 
或 者 直接 删除 。 


2.3 ”数据 仓库 的 优势 


数据 仓库 系统 相 比 其 他 系统 有 有 以 下 儿 个 优势 : 

(1) 数据 仓库 系统 可 以 获取 生产 系统 综合 的 信息 ， 作 为 科学 决 集 分 析 的 重要 依据 。 
(2) 可 以 从 宏观 和 微观 的 角度 理解 信息 。 

G) 可 以 通过 数据 仓库 系统 建立 起 企业 各 个 部 门 之 间 的 联系 。 


24 ”数据 仓库 和 数据 库 的 区 别 


数据 库 系 统 主要 是 面 癌 应 用 的 、 事 务 型 的 数据 处 理 ， 一 般 来 说 具有 实时 性 较 融 ， 数 据 检 
索 量 较 小 ， 普 通用 户 的 数量 较 大 等 特点 。 而 数据 仓库 系统 主要 是 面向 主题 的 、 分 析 型 的 数据 
处 理 ， 具 有 实时 性 要 求 不 高 ， 数 据 检 索 量 较 大 ， 主 要 针对 特殊 的 用 户 群 体 (一 般 是 企业 局 层 
领导 、 决 策 分 机 人 员 等 ) 用 户 的 数量 较 小 等 特点。 其 中 事务 型 和 分 析 型 处 理 数 据 是 有 区 别 的 ， 
事务 型 处 理 数 据 一 般 来 说 对 性 能 的 要 来 较为 严格 ， 数 据 是 事务 驱动 的 ， 主 要 面向 应 用 ， 存 储 
的 一 般 痢 是 即时 性 、 细 证 性 的 数据 ， 数 据 是 可 更新 的 ; 而 分 析 型 的 处 理 数据 对 性 能 的 要 求 较 
司 ， 数 据 是 由 分 析 驱 动 的 ， 主 要 面向 决 集 分 析 ， 存 储 的 一 般 帮 古 历史 、 汇 忌 性 的 数据 ， 数 据 
古 个 可 更 狐 的 。 


2.9 ”数据 仓库 开发 过 程 介绍 


数据 仓库 开发 应 用 过 程 主要 包括 以 下 几 个 方面 : 规划 分 析 阶 段 、 设 计 实 现 阶 段 、 使 用 维 
护 阶 段 。 


2.5.1 规划 分 析 阶 段 


上 首先， 确定 数据 仓库 项 目的 开发 目标 。 从 用 户 需 求 角 度 分 析 ， 给 用 户 提 供 哪些 决策 分 析 
内 容 和 功能 。 从 技术 角度 分 析 , 在 划分 的 各 个 主题 中 需要 哪些 业务 数据 源 , 确定 使 用 哪 种 ETL 
工具 去 抽取 数据 ， 使 用 什么 工具 构建 数据 模型 ， 确 定数 据 仓库 的 实现 范围 ， 然 后 制订 数据 仓 
库 项 目 目标 和 工程 计划 。 

然后 ， 对 实施 数据 仓库 项 目 开发 的 所 有 预算 进行 有 效 估计 ， 编 写 详细 的 开 肥 说 明 书 ， 说 
明 该 数据 仓库 系统 对 企业 发 展 的 作用 。 内 容 包括 对 工作 任务 概况 的 说 明 、 重 点 文 持 该 项 目的 
业务 部 门 和 设计 开发 的 工作 计划 等 。 

然后 ， 开 展 概念 模型 设计 工作 。 欠 容 主 要 包括 用 户 需求 调研 、 模 型 的 定义 和 需求 分 析 等 
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内 容 。 移 明确 用 户 的 需求 ; 在 理解 用 户 需 求 的 基础 上 ， 进 行 数据 仓 库 概 念 模型 的 设计 ， 还 包 
括 摊 写 详细 的 用 户 需 求 分 析 调 得 表 和 针对 概念 醒 型 的 评审 报告 。 

最 后 ， 在 概念 模型 的 基础 上 进行 馆 辑 模型 的 分 析 和 设计 。 内 容 包括 : 所 要 分 析 的 主题 域 
有 哪些 ， 主 题 域 中 包含 的 主题 和 实体 有 哪些 ， 实 体 粒度 层级 的 定义 等 内 容 。 除 此 之 外 ， 还 需 
要 搂 写 逻辑 模型 的 评审 报告 和 定义 数据 仓库 的 抽取 流程 。 


2.5.2 ”设计 实现 阶段 


设计 阶段 主要 包括 商业 智能 项 目 体 系 结构 的 设计 。 在 设计 阶段 主要 包括 数据 模型 的 设计 ， 
元 数据 的 设计 ，ETL 数据 抽取 、 转 换 、 加 载 的 设计 ， 报 表 展 现 设计 等 内 容 。 其 中 元 数据 包括 
业务 元 数据 、 技 术 元 数据 和 管理 元 数据 ， 它 们 之 间 的 具体 区 别 在 后 续 内 容 中 详细 介绍 。 在 实 
现 阶段 ， 需 要 确定 数据 仓库 系统 选择 了 哪些 业务 数据 源 ， 实 现 从 源 系 统 中 抽取 数据 、 清 洗 数 
据 、 装 载 数 据 的 设计 和 编码 过 程 ， 使 用 报表 展现 工具 开发 报表 。 在 设计 和 开发 阶段 选 定 建 模 
工具 ， 为 数据 仓库 填充 测试 数据 ， 一 般 来 说 ， 需 要 选择 3 年 或 者 3 年 以 上 的 测试 数据 ， 例 如 
可 选择 2006—2009 年 的 数据 。 


2.5.3 ”使 用 维护 阶段 


使 用 阶段 包含 的 内 容 有 : 针对 用 户 的 增 训 ， 使 用 户 明白 数据 仓库 的 工作 原理 ， 通 过 实际 
操作 使 用 户 清 楚 如 何 使 用 数据 仓库 ， 数 据 仓 库 可 以 实现 哪些 功能 等 。 而 数据 仓库 运 维 内 容 则 
主要 包括 : 

OD 备份 与 恢复 

数据 仓库 数据 的 定期 备份 与 恢复 是 数据 仓库 项 目 一 个 必 不 可 少 的 运 维 步骤 。 这 是 为 了 保 
证 用 户 使 用 的 同时 ， 也 对 数据 仓库 中 的 数据 进行 妥善 处 理 ， 以 应 对 将 来 历史 数据 的 增加 和 数 
据 仓库 规模 的 扩大 。 

(2) 数据 归档 

在 数据 仓库 项 目 中 ， 数 据 归 档 也 是 一 个 非常 重要 的 运 维 步骤 。 历 史 数 据 大 量 的 增加 使 数 
据 仓库 需要 增加 额外 的 存储 设备 来 存储 这 些 数据 ， 这 也 产生 了 额外 的 开销 。 如 何 将 这 些 海量 
的 、 历 史 细 克 性 的 数据 有 效 地 管理 起 来 ， 是 数据 仓库 运 维 过 程 中 最 重要 的 组 成 部 分 。 因 为 数 
据 量 的 不 断 增加 ， 数 据 仓库 对 这 些 数据 不 断 地 进行 备份 ， 不 仅 增 加 了 系统 的 复杂 度 ， 也 严重 
影响 了 系统 的 性 能 。 正 因为 如 此 ， 数 据 仓库 需要 将 历史 细节 性 数据 归档 到 离线 的 存储 设备 上 ， 
从 而 降低 运 维 的 难度 。 

(3) 性 能 管理 与 监控 

同 备份 与 恢复 、 数 据 归 档 相 比 ， 系 统 监 探 过程 更 加 复杂 化 。 系 统 监控 包括 对 数据 库 的 监 
控 和 对 业务 系统 的 监控 。 数 据 库 的 监控 可 以 帮助 系统 管理 员 对 数据 库 系 统 进行 必要 的 优化 ， 
以 满足 末 来 日 益 增 加 的 数据 容量 需求 和 对 性 能 的 要 求 。 对 业务 系统 的 监控 是 为 了 保证 数据 仓 
库 系 统 的 正常 运行 。 性 能 是 数据 仓库 项 目 必 须要 考虑 的 问题 ， 由 于 数据 量 巨 大 ， 在 设计 过 程 
中 每 个 步骤 都 需要 考虑 系统 性 能 的 问题 ， 包 括 对 数据 库 的 各 种 优化 。 性 能 管理 主要 包括 : 用 
户 针对 业务 系统 响应 的 时 间 、 文 件 传输 的 时 间 、 数 据 备 份 和 恢复 的 时 间 、ETEL 的 时 间 和 报表 
展示 的 时 间 等 方面 。 
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(4) 用 户 培训 

者 训 的 目的 是 让 用 户 对 数据 仓库 系统 的 结构 、 功 能 和 操作 流程 有 一 个 比较 清晰 的 认识 ， 
用 户 能 够 依靠 培训 手册 学 会 基本 的 操作 和 了 解 该 系统 提供 的 各 种 功能 。 在 进行 用 户 培 训 之 前 ， 
需要 详细 地 列 出 培训 的 计划 和 方案 ， 例 如 列 出 本 次 培训 的 目的 、 时 间 、 日 程 和 内 容 安 排 、 培 
训 的 人 员 等 内 容 。 

使 用 维护 阶段 如 图 2-3 所 示 。 



























用 户 
培训 


图 2-3 使 用 维护 阶段 


总 结 : 数据 仓库 的 开发 周期 可 以 划分 成 规划 分 析 阶 段 、 设 计 实 现 阶段 以 及 使 用 维护 阶 
Bt. 这 3 个 阶段 是 不 断 循环 和 完善 的 过 程 ,经 过 多 次 循环 设计 、 开 发 和 改进 ， 不断 为 系统 增 
加 新 的 功能 , 使 数据 仓库 系统 的 应 用 得 到 进一步 的 加 强 , 同时 为 了 你 证 数据 仓库 系统 开发 的 
有 效 进 行 ， 用 户 需 要 在 关键 步骤 中 投入 更 多 的 资源 。 数 据 仓 库 系 统 开发 与 应 用 的 过 程 如 
图 2-4 所 示 。 














e e 数据 仓库 测试 数据 仓库 系统 

的 规划 和 需求 数据 的 填充 的 开发 和 实施 
分 析 

概念 模型 的 数据 仓库 系统 

逻辑 模型 的 物理 模型 的 数据 仓库 系统 
设计 设计 的 维护 


数据 仓库 体系 MM 
结构 的 设计 元 数据 的 设计 


图 2-4 数据 仓库 系统 开发 与 应 用 的 过 程 
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2.6 ”数据 仓库 系统 组 成 部 分 介绍 


数据 仓库 系统 的 组 成 部 分 有 : 针对 数据 源 的 分 析 、 数 据 的 迁移 、 数 据 的 存储 结构 、 元 数 
据 管 理 等 。 

其 中 数据 仓库 系统 的 数据 源 分 析 是 开启 商业 智能 项 目的 第 一 道 大 门 , 也 是 最 基本 的 一 步 。 
业务 系统 的 源 数 据 通常 来 自 企业 的 内 部 信息 和 外 部 信息 。 所 谓 内 部 信息 ， 是 指 来 自 企 业 的 生 
产 数 据 和 历史 归档 数据 。 而 企业 的 生产 数据 有 可 能 来 自 于 不 同 的 业务 系统 ， 如 何 将 这 些 业务 
数据 进行 标准 化 ， 转 换 成 数据 仓库 可 以 存储 的 数据 ， 从 而 保证 数据 仓库 中 数据 的 一 致 性 ， 这 
是 数据 源 分 析 最 重要 的 一 步 。 归 档 历 史 数 据 一 般 是 指 将 大 量 的 、 不 常用 的 历史 数据 以 在 线 的 
方式 或 者 以 离线 的 方式 存储 在 数据 库 中 或 者 磁带 机 中 ， 这 些 历史 数据 有 可 能 会 成 为 数据 仓库 
系统 分 析 未 来 趋势 和 探究 根本 原因 的 宝贵 财富 。 外 部 信息 EAREN 
一 般 包括 企业 的 法 律 法 规 、 该 行业 的 市 场 信息 和 该 企业 竞 — —— 















































" PANEM T Xo E “生产 数据 “法 律 法 规 
种 对 手 的 信息 ， 例 如 该 企业 范 特 对 手 的 市 场记 有 率 信 息 。 penes poss 
企业 内 部 信息 和 外 部 信息 如 图 2-5 所 示 。 “企业 竞争 对 手 
数据 的 迁移 部 分 主要 包括 数据 的 抽取 、 转 换 和 加 载 3 BR 
个 部 分 。 


m " "- " u 2-5 企业 内 部 信息 和 外 部 信息 
存储 与 管理 是 数据 仓库 的 核心 工作 。 因 为 数据 仓库 特 。 00275 企业 站 部 信息 和 外 i 


有 的 组 织 管理 方式 区 别 于 传统 的 数据 库 管 理 ， 它 是 按照 主题 的 形式 对 业务 源 数据 进行 抽取 、 
转换 、 加 载 和 集成 的 。 在 数据 仓库 中 ， 存 储 了 大 量 的 历史 数据 ， 将 这 些 宝 贯 的 历史 数据 转换 
成 可 以 分 析 的 、 稳 定 的 数据 是 数据 仓库 的 根本 任务 和 目的 。 

元 数据 的 管理 主要 包括 技术 元 数据 和 业务 元 数据 的 管理 。 

下 面 对 此 进行 详细 的 说 明 。 


2.6.1 ZA A T 


数据 源 是 数据 仓库 系统 所 有 信息 的 源头 ， 主 要 是 操作 型 业务 应 用 系统 存放 的 数据 集合 。 
数据 源 分 析 是 指 对 业务 数据 源 中 的 原始 数据 进行 分 析 ， 得 到 数据 的 范围 、 格 式 ， 以 及 其 更 新 
方式 、 更 痢 频 率 、 质 量 等 方面 的 信息 。 商 业 智 能 系统 本 身 束 是 一 个 数据 分 析 的 系统 ， 对 数据 
源 的 分 析 是 开局 商业 智能 项 目 大 门 的 过 程 ， 效 据 仓 库 系 统 需要 文 持 多 种 数据 源 格式 ， 为 了 确 
定 抽取 方式 ， 需 要 对 数据 源 进 行 详细 的 分 析 。 

在 分 析 的 过 程 中 ， 需 要 人 确定 业务 源 数 据 中 哪些 数据 需要 被 抽取 。 为 了 确定 合适 的 抽取 方 
陈 ， 需 要 在 抽取 之 前 对 数据 汰 进行 分 析 ， 分 析 的 范围 一 般 包 括 数 据 的 格式 、 数 据 的 范围 、 更 
新 的 方式 、 数 据 质量 的 好 坏 。 在 分 析 的 过 程 中 ， 应 该 尽 可 能 获取 分 析 的 结束 ， 形 成 数据 源 分 
析 报 告 ， 在 仔细 研究 分 析 报 告 后 ， 再 选择 合适 的 抽取 、 加 载 方式 。 

在 分 析 时 ， 应 该 抛弃 实际 的 应 用 系统 ， 在 逻辑 上 重新 确定 目标 表 中 需要 哪些 业务 数据 ， 
然后 再 根据 业务 系统 的 实现 方式 ， 分 析 业 务 源 数据 的 存储 格式 、 更 新 频率 、 更 痢 方 式 和 数据 
质量 。 

可 以 得 出 这 样 的 结论 : 所 谓 数 据 源 分 析 ， 束 是 对 源 数 据 进 行 分 析 和 上 总结 ， 得 出 源 数据 有 的 
汇 围 、 格 式 、 喝 新 方式 、 喝 新 频 京 和 质量 好 坏 的 过 程 。 
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分 析 、 质 量 分 析 4 个 方面 ， 如 图 2-6 所 示 。 
1) 范围 分 析 是 指 分 析 数 据 的 范围 。 用 户 需要 确定 数据 
仓库 系统 需要 数据 源 中 的 哪些 原始 数据 。 例 如 ,在 某 电力 企 ^ 
业 的 销售 电量 分 析 主题 中 , 所 有 的 数据 均 来 自 某 管理 信息 系 CN m 
统 ， 由 此 可 以 确定 ， 这 个 销售 电量 分 析 主 题 的 数据 源 都 来 自 所 D> 人 
该 管理 信息 系统 , 可 能 是 与 这 个 管理 系统 中 的 客户 相关 的 数 5 
据 , 或 者 与 电量 相关 的 数据 ,而 与 财务 数据 或 用 户 欠 费 相关 
的 业务 数据 则 不 包含 在 内 。 EHE 
2) 格式 分 析 是 指 对 原始 数据 在 数据 库 中 的 物理 存储 方 
式 进行 分 析 。 内 容 包括 在 数据 库 中 的 存储 类 型 、 存 储 长 度 、 — 





数据 精度 等 指标 。 

3) 更 新 方式 分 析 是 指 对 原始 数据 在 应 用 系统 中 的 更 新 方式 、 更 痢 频 率 、 更 新 内 容 进 
行 分 析 判 断 。 内 容 包 括 原 始 数 据 何 时 更 新 、 更 新 方式 、 其 体 更 新 哪些 内 容 等 。 例 如 ， 在 某 
销售 电量 主题 分 析 中 ， 需 要 郊 虚 用户 的 抄 表 数 据 和 电量 数据 ， 一 般 部 是 每 月 增 量 更 独 的 ， 
而 用 户 的 档案 信息 也 有 可 能 进行 更 新 , 例如 用 户 的 欠 费 信息 也 随 看 用 户 的 缴费 行为 而 随时 
发 生 相 应 的 变化 。 

4) 质量 分 析 是 指 分 析 业 务 源 数据 的 质量 。 主 要 分 析 数 据 完 整 性 、 数 据 准 确 性 、 数 据 
一 致 性 等 内 容 。 一 般 步 又 包 括 : 设计 数据 质量 定义 文档 ， 内 容 包括 数据 质量 验收 的 依据 ， 
数据 质量 等 级 的 划分 ， 数 据 质量 检 碍 的 流程 等 内 容 ; 再 根据 数据 质量 定义 文档 进行 数据 质 
量 检 查 ， 最 终 形成 质量 报告 ; 根据 数据 质量 报告 进行 深入 分 析 ， 将 分 析 结 果 提 交 给 相关 人 
R, 协助 设计 人 员 完 成 数据 清洗 规则 的 制定 。 通 常 ， 质 量 分 析 是 数据 源 分 析 中 最 重要 、 工 
作 量 最 多 的 部 分 。 

总 结 : 除 以 上 所 述 对 数据 源 进行 的 分 析 外 ， 还 需要 对 各 项 指标 数据 的 确切 含义 ， 统 计 口 
径 等 信息 进行 明确 的 界定 ， 以 避免 产生 二 义 性 。 例 如 ， 在 销售 电量 主题 分 析 中 ， 需 要 明确 销 
售 电量 的 确切 含义 ， 例 如 是 否 包含 线 损 电量 、 变 损 电量 等 。 


2.6.2 ”数据 迁移 


数据 迁移 是 商业 智能 的 重点 ， 可 以 归纳 为 如 下 3 点 。 

(1) 数据 抽取 

数据 抽取 击 需 要 弄 消 楚 儿 个 问题 ， 数据 源 来 日 于 哪儿 个 业务 系统 ， 各 个 业务 系统 的 数据 
库 管 理 系统 分 别 是 什么 ， 是 合 存 在 手工 孙 入 的 情况 。 

在 确定 数据 抽取 方式 时 ， 根 据 不 同情 况 ， 不 同业 务 源 数 据 的 抽取 方式 可 能 不 相同 。 在 对 
数据 抽取 方式 进行 设计 时 ， 表 先 根 据 数据 抽取 的 范围 ， 佑 算出 每 次 抽取 的 数据 量 ， 然 后 再 从 
实际 的 业务 系统 数据 库 服务 器 当 前 的 运行 情况 ，ETL 服务 兹 与 业务 系统 数据 库 服务 占 之 间 的 
网 络 连 接 情 况 ， 客 户 对 数据 实时 性 的 要 求 等 方面 考虑 ， 选 择 最 合适 的 抽取 方式 。 

数据 抽取 可 以 有 两 种 方式 : 直接 抽取 方式 、 间 接 抽取 方式 。 

在 进行 数据 抽取 时 ， 移 明确 每 个 数据 表 采 用 何 种 数据 抽取 方式 。 直 接 抽取 方式 是 指数 据 
抽取 过 程 中 直接 从 业务 源 数 据 库 到 目标 库 ， 中 间 没 有 经 历 过 任何 过 渡 。 但 是 直接 抽取 方式 必 
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须 确定 业务 系统 数据 库 为 ETL 过 程 捉 供 的 数据 库 用 户 名 、 授 权 给 该 用 户 访问 的 表 名 称 ， 对 该 
用 户 授 权 的 方式 、 数 据 抽 取 时 相关 的 安全 措施 等 内 容 。 间 接 抽 取 方 式 是 指 采 用 文件 交换 的 方 
式 进行 数据 抽取 ， 需 要 考虑 网 络 连接 、 数 据 库 的 分 布 等 客观 因素 。 在 文件 交换 的 过 程 中 ， 需 
要 确定 文件 交换 的 位 置 、 文 件 的 格式 、 对 文件 完整 性 的 检查 、 文 件 传输 的 方式 、 文 件 是 否 传 
得 完毕 的 标记 、 文 件 重新 传递 的 标记 等 内 容 。 间 接 抽取 方式 也 称 做 异步 ETL 方式 。 

(2) 数据 转换 

数据 转换 的 含义 古 将 业务 系统 内 的 各 种 源 数 据 ， 通 过 目 定 义 的 转换 脚本 或 者 其 他 一 些 计 
算 方法 ， 将 源 数据 转换 成 符合 数据 仓库 要 求 的 数据 。 转 换 过 程 包含 了 对 数据 不 一 致 性 的 转换 ， 
数据 粒度 的 转换 和 满足 一 些 计 算 指 标的 转换 。 

如 条 转 换 的 目标 表 是 针对 数据 集 市 中 的 表 ， 那 么 当 每 一 个 字段 三 定好 转换 规则 后 ， 需 要 
对 同一 表 中 的 所 有 子 段 进行 综合 ， 以 SQL 语句 的 方式 记录 下 来 。 这 期 间 包 含 了 将 业务 系统 数 
据 按 照 数据 仓库 粒度 进行 聚合 的 过 程 。 对 于 比较 复杂 的 转换 规则 ， 无 法 在 一 个 SQL 语句 中 完 
整地 表现 一 个 表 所 有 字段 的 ， 可 以 拆 分 为 多 个 SQL 语句 。 

在 这 一 步 ， 需 要 形成 转换 规则 文档 。 内 容 包 括 数据 集 市 中 的 所 有 字段 如 何 关 联 到 业务 系 
统 中 的 各 个 字段 ， 以 及 每 个 字段 的 运算 转换 函数 及 参数 ， 转 换 的 方法 ， 还 包括 每 个 表 的 SQL 
转换 语句 等 内 容 。 

G) TD RES 

数据 经 过 转换 、 清 洗 后 ， 需 要 装载 到 目标 数据 库 中 。 数 据 装 载 的 方式 有 多 种 : 全 表 对 比 
方式 、 时 间 鹤 方式 、 日 筷 表 的 方式 、 全 表 删 除 后 再 插入 的 方式 。 这 部 分 内 容 在 后 续 章 节 中 将 
有 详细 的 介绍 ， 在 此 不 再 资 述 。 


2.6.3 ”选择 数据 的 存储 结构 


数据 库 管 理 系统 一 般 都 提供 多 种 存储 结构 。 所 谓 数据 的 存储 结构 ， 是 指数 据 的 饮 辑 结构 
在 计算 机 系统 中 的 表示 。 

设计 人 员 根 据 实际 的 需求 选择 合适 的 数据 存储 结构 , 不 同 的 存储 结构 有 不 同 的 实现 方式 ， 
各 有 各 的 特点 。 对 设计 人 员 来 说 ， 考 碟 的 主要 因素 包括 以 下 3 个 方面 : 存储 的 时 间 、 存 储 空 
闻 的 利用 率 和 数据 维护 的 成 本 。 

一 般 在 ODS 数据 存储 结构 说 明 书 中 ,需要 详细 说 明 这 些 数 据 采 用 的 存储 结构 ， 以 及 采用 
该 存储 结构 的 原因 。 


2.6. ”元 数据 


元 数据 主要 包括 技术 元 数据 、 业 务 元 数据 和 管理 元 数据 。 

(1) 技术 元 数据 

技术 元 数据 是 存储 关于 商业 智能 系统 技术 细节 的 数据 ， 是 用 于 开发 和 管理 商业 智能 系统 
使 用 的 数据 。 它 主要 包括 以 下 信息 : 商业 智能 系统 结构 的 描述 ， 包 括 对 数据 源 、 数 据 转 换 、 
抽取 过 程 、 数 据 加 载 策略 以 及 对 目标 数据 库 的 定义 等 内 容 ， 数 据 仓 库 使 用 的 模式 、 视 图 、 维 
度 、 层 次 结构 、 类 别 和 属性 的 定义 ， 以 及 立方 体 的 存储 模式 等 信息 。 

总 之 ， 技 术 元 数据 提供 给 系统 管理 人 员 和 数据 仓库 开发 人 员 使 用 ， 管 理 人 员 需 要 了 解 操 
作 环 境 到 商业 智能 环境 的 映射 天 系 〈 即 ETL 数据 抽取 的 映射 关系 )， 数 据 的 刷新 规则 ， 数 据 
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的 安全 性 ， 数 据 库 优化 和 任务 调度 等 内 容 。 数 据 仓库 开 及 人员 需 要 了 解 度 量 值 和 维度 定义 的 
算法 。 在 实际 商业 智能 开发 过 程 中 ， 业 务 元 数据 和 技术 元 数据 是 相互 天 联 的 ， 对 元 数据 的 深 
刻 理 解 是 数据 仓库 应 用 和 维护 的 基础 。 

(2) 业务 元 数据 

业务 元 数据 从 业务 角度 描述 了 商业 智能 系统 中 的 数据 ， 征 介 于 使 用 者 和 真实 系统 乙 间 的 
语义 屋 ， 使 得 不 虱 计 算 机 技术 的 业务 人 员 也 能 够 “理解 ”商业 智能 系统 中 的 数据 。 业 务 元 数 
据 使 用 业务 名 称 、 定 义 、 摘 述 等 信息 表示 数据 仓库 中 的 各 种 属性 和 概念 。 业 务 元 数据 主要 包 
括 以 下 信息 ; 用 户 的 业务 术语 和 它们 表达 的 数据 模型 信息 、 对 和 象 名 称 及 其 属性 ， 数 据 的 来 源 
言 轧 和 数据 访问 的 规则 信息 ， 商 业 智 能 系统 提供 的 各 种 分 析 方 法 以 及 报表 展示 的 信息 。 业 务 
元 数据 使 数据 仓库 管理 人 员 和 用 户 更 好 地 理解 和 使 用 数据 仓库 ， 用 户 通 过 但 看 业务 元 数据 可 
以 清晰 地 理解 各 指标 的 含义 和 计算 方法 等 信息 。 

业务 元 数据 的 作用 包括 : 便于 商业 智能 系统 的 集成 和 可 重用 ， 保 证 数据 仓库 的 数据 质量 
和 可 维护 性 ， 帮 助 业 务 人 员 和 技术 人 员 更 好 地 理解 当前 业务 和 系统 数据 ， 提 高 商业 智能 系统 
的 管理 效率 。 

(3) 管理 元 数据 

管理 元 数据 是 描述 管理 领域 相关 概念 、 关 系 和 规则 的 数据 ， 主 要 包括 人 员 有 角色 、 立 位 职 
责 和 管理 流程 等 。 这 部 分 内 容 在 后 续 音 节 中 将 有 详细 的 介绍 ， 在 此 不 再 釜 述 。 
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数据 仓库 模型 是 指 用 实 休 、 属 性 、 实 体 之 间 的 关系 对 业务 概念 和 风 辑 规则 进行 统一 的 定 
义 、 命 名 和 编码 ， 主 要 描述 企业 的 信息 需求 和 业务 规则 ， 是 业务 人 员 和 开发 人 员 沟 通 的 语言 ， 
是 数据 仓库 架构 设计 工作 开始 的 第 一 步 。 正 确 的 数据 仓库 模型 是 用 户 需求 的 集中 体现 ， 是 商 
业 智能 项 目 成 功 与 否 最 重要 的 因素 之 一 。 数 据 仓库 模型 可 以 分 为 概念 模型 、 罗 辑 模型 、 物 理 
模型 ， 本 节 将 一 一 介绍 。 


2.7.1 ”概念 模型 


从 定义 上 来 说 ， 概 念 模型 是 最 高 层次 的 数据 模型 ， 反 映 了 数据 仓库 的 主题 和 重要 业务 之 
间 的 关系 。 一 般 来 说 ， 在 进行 数据 仓库 系统 设计 和 开发 之前 ， 设 计 开 发 人 员 和 业务 人 员 已 经 
对 概念 模型 达成 了 共识 ， 因 为 概念 模型 反 
映 的 是 核心 的 业务 问题 。 

概念 模型 的 设计 步骤 如 下 : 



























































表 2-1 数据 主题 及 其 解释 











数据 主题 对 数据 主题 的 详细 解释 
D 从 业务 需求 中 提取 重要 的 业务 数据 — EEE f sium 
N HT NS. pn YN < T FH JG Ua d SU J? 
主题 ， 包 括 对 业务 数据 主题 的 详细 解释 ，。 一 一 一 
见 表 2-1。 Sumo | 公司 人 员 蘑 天 、 福 利 相关 的 各 种 数据 


2) 在 业务 数据 主题 的 基础 上 进行 数据 社会 保险 信息 社会 保险 分 类 定义 信息 
主题 域 的 划分 ， 包 括 对 数据 主题 域 的 详细 劳动 保障 信息 劳动 保障 分 类 定义 信息 
解释 ， 如 图 2-7 所 示 。 社保 缴纳 人 员 参 与 社会 保险 的 记录 
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F SIR Be E 
人 员 基 本 信息 





人 员 与 组 织 主 题 域 描 
述 的 是 ， 在 企业 业务 
活动 中 的 人 员 和 组 织 


机 构 的 信息 





人 员 职 位 信息 


a) b) 





图 2-7 ”人员 与 组 织 主题 域 包括 的 信息 及 解释 
a) 人 员 与 组 织 主 题 域 包括 的 信息 0) 对 人 员 与 组 织 主 题 域 的 详细 解释 


3) 划分 主题 域 概念 模型 : 根据 数据 主题 域 的 划分 ， 细 化 内 部 的 组 织 结构 和 业务 关系 ， 如 
图 2-8 所 示 。 

总 结 : 概念 模型 建 模 的 流程 大 致 可 以 分 成 如 下 几 个 部 分 : 通过 对 业务 系统 的 详细 说 明 ， 
进行 数据 的 梳理 ， 列 出 数据 主题 详细 的 清单 ， 并 对 每 个 数据 主题 都 作出 话 细 的 解释 ， 然 后 经 
过 归纳 、 分 类 ， 整 理 成 各 个 数据 主题 域 ， 列 出 每 个 数据 主题 域 包含 哪些 部 分 ， 并 对 每 个 数据 
主题 域 作出 详细 解释 ， 最 后 划分 成 主题 域 概念 模型 ， 如 图 2-9 所 示 。 














对 业务 系统 进行 详细 的 说 明 


ien 







薪酬 福利 信息 












数据 主题 域 
uid 
图 2-8 划分 主题 域 概念 模型 图 2-9 概念 模型 设计 流程 图 
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从 定义 上 讲 ， 人 逻辑 模型 是 以 概念 模型 为 基础 ， 并 对 概念 模型 的 进一步 细 化 、 分 解 而 成 的 。 
人 馆 辑 模型 通过 实体 和 实体 之 间 的 关系 描述 业务 的 需求 和 系统 实现 的 扩 术 领域 ， 是 业务 需求 人 
员 和 拉 术 人 员 沟 通 的 桥 染 和 平台 。 概 念 模型 和 逻辑 模型 的 关系 如 图 2-10 所 示 。 

(1) 风 辑 模型 的 设计 

逻辑 模型 的 设计 是 数据 仓库 实施 中 最 重要 的 一 步 ， 因 为 它 朋 接 有 反映 了 业务 部 门 的 实际 十 
求 和 业务 规划 ， 同 时 对 物理 模型 的 设计 和 实现 共有 指 呈 作用 。 它 的 特点 束 是 通过 实体 和 实体 
之 间 的 关系 勾勒 出 整个 企业 的 数据 贤 图 和 规划 。 逆 辑 柑 型 一 般 名 循 第 三 范式 ， 与 概念 模型 不 
同 ， 它 主要 关注 细 市 性 的 业务 规则 ， 同 时 需要 解决 每 个 主题 域 包含 哪些 概念 范畴 和 跨 主 题 域 
的 继承 和 共 圣 的 问题 。 

(20 风 辑 柑 型 设计 的 一 般 步 又 

概念 模型 的 主题 域 一 般 是 从 企业 现 有 的 信息 系统 和 行业 自身 业务 活动 汇总 得 来 的 业务 模 
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型 主题 域 。 而 逻辑 模型 除了 在 概念 模型 的 基础 上 丰富 和 细 化 主题 域 ， 并 且 确 定 每 个 主题 域 包 
含 哪些 主题 外 ， 还 需要 以 下 几 个 步 又。 





逻辑 模型 


概念 模型 









社会 保险 信息 薪酬 福利 信息 


人 员 与 组 织 主 题 域 


员工 基本 信息 









培训 信息 





职位 信息 





图 2-10 概念 模型 和 逻辑 模型 的 天 系 
1) 分 析 需 求 ， 列 出 需要 分 析 的 主题 、 需 求 目标 、 维 度 指 标 、 维 度 层次 、 分 析 的 指标 、 分 
析 的 方法 、 数 据 的 来 源 、 关 注 的 对 象 等 。 例 如 ， 上 要 分 析 的 主题 是 电力 营销 业务 分 析 处 理 情 
Pa 见 表 2 2o 








表 2-2 电力 营销 业务 分 析 人 处 理 情况 





分 析 对 人 象 4) Br 2j X 

需求 目标 按照 时 间 、 单 位 、 用 电 类 型 分 析 用 电容 量 、 用 户 数 
维度 指标 时 间 、 电 压 等 级 

维度 层次 时 间 是 年 、 季 、 月 ， 电 压 等 级 是 6KV、10KV 
分 析 的 指标 用 户 数 量 、 用 电 储 存 容量 

分 析 的 方法 同比 > 环比 

数据 的 来 源 电力 营销 系统 

关注 的 对 象 公司 领导 、 中 层 管理 人 员 、 业 务 人 员 


2) 选择 用 户 感 兴趣 的 数据 ， 通 过 业务 需求 将 需要 分 析 的 指标 分 离 抽取 出 来 ， 转 化 成 旬 辑 
模型 需要 的 实体 。 例 如 ， 从 用 户 数 量 、 用 电 储 存 容 量 等 分 析 指 标 中 分 离 出 用 户 实体 和 用 电量 
实体 。 

3) 在 实体 中 需要 增加 时 间 戳 属性 ， 因 为 实体 中 需要 保存 各 个 阶段 的 历史 数据 。 通 向 情 况 
下 ， 如 果实 体 为 统一 编码 ， 则 不 需要 增加 时 间 戳 属性 。 

4) 需 要 考虑 粒度 层次 的 划分 。 数 据 仓 库 的 粒度 层次 划分 直接 影响 了 数据 仓库 模型 的 设计 ， 
通 第 细 粒 上 度 的 数据 模型 直接 从 企业 模型 选取 实体 作为 逻辑 模型 的 实体 ， 而 粗 粒 度 的 数据 模型 
需要 经 过 六 总 计算 得 到 相应 的 实体 。 粒 度 决 定 了 企业 数据 仓库 的 实现 方式 、 性 能 、 灵 活性 和 
数据 仓库 的 数据 量 。 

5) 在 粒度 层次 划分 的 基础 上 ， 还 需要 进行 关系 模式 的 定义 。 关 系 模式 一 般 采 取 第 三 范式 
的 特点 进行 定义 ， 对 当前 的 主题 进行 天 系 模 式 的 划分 ， 形 成 各 个 实体 、 实 体 属性 、 实 体 之 间 
的 关系 等 内 容 。 同 时 在 逻辑 模型 框架 的 基础 上 对 实体 的 中 英文 名 称 、 属 性 、 属 性 的 值 域 进行 
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明确 、 完 善 和 细 化 ， 真 实 反 映 业 务 饮 辑 关系 和 业务 规则 。 





罗 辑 模型 的 设计 流程 图 如 图 2-11 所 示 。 1 
2.7.3 ”物理 模型 e» 选择 感 兴趣 的 数据 
(I) 物理 借 于 设计 阶段 D rran 
在 逻辑 模型 的 基础 上， 为 应 用 生产 环境 选取 一 个 合适 的 物 
理 结构 的 过 程 ， 包 括 合适 的 存储 结构 和 存储 方法 ， 称 作物 理 模 。 志 昂 arnis 
型 的 设计 过 程 。 
逻辑 模型 转变 为 物理 模型 包括 以 下 几 个 步 又 : ”关系 模式 的 定义 


1) 实体 名 〈Entity) 转变 为 表 名 (Table). 

2) 属性 名 (Attribute〉 转 换 为 列 名 (Column)， 确 定 列 的 
属性 (Property)。 

(2) 实现 业务 规则 

物理 模型 必须 对 列 的 属性 进行 明确 的 定义 ， 包 括 : 列 名 、 数 据 类 型 (与 特定 数据 库 管 理 


图 2-11 逻辑 模型 的 设计 流程 图 








系统 有 关 )、 长 度 、 能 人 盏 为 空 值 、 有 效 性 规则 、 默 认 值 等 ， 如 图 2-12 所 示 。 


军火 类 型 维 表 
军火 编码 CHAR <pk> 
军火 名 称 CHAR 


主键 ID CHAR <k> 

日 期 编码 CHAR <fk2> 

军火 编码 CHAR «fki» 
CHAR 
CHAR 
CHAR 





图 2-12 ”数据 仓库 的 物理 模型 


物理 模型 确定 以 后 ， 可 以 进一步 确定 数据 的 存放 位 置 和 存储 空间 的 分 配 ， 最 后 生成 定义 
数据 库 的 SQL 命令 。 
概念 模型 、 逻 辑 模 型 和 物理 模型 的 区 别 如 图 2-13 所 示 。 


。 最 高 层次 的 数 。 是 概念 模型 的 。 描述 模型 实体 
据 模 型 进一步 细 化 的 细 市 
。 定义 了 重要 的 。 — Bo 089 — 。 对 列 的 属性 进 











业务 概 您 和 关 范式 行 明 确 的 定义 
系 。 描 述 实体 、 属 
。 包含 核心 的 数 性 及 其 关系 
据 主 题 和 主题 
间 的 业务 关系 





图 2-13 ”概念 模型 、 逻 辑 模 型 和 物理 模型 的 区 列 
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2.8 ”数据 集 市 介绍 


2.8.1 数据 集 市 概述 


1. 数据 集 市 产生 原因 

(1) 数据 仓库 能 够 满足 所 有 最 终 用 户 的 需求 ,但 是 各 个 部 门 业 务 不 同 ， 需 求 侧重 点 不 同 ， 
是 需求 也 是 不 断 变 化 的 。 这 束 要 求 数 据 仓 库存 储 的 数据 其 有 充分 的 灵活 性 ， 以 适应 各 类 用 户 
的 得 询 和 分 析 。 

(2) 最 终 用 户 对 信息 检索 要 求 是 高 性 能 的 ， 即 越 快 越 好 。 

对 效 据 仓库 而 言 ， 素 活性 和 性 能 是 一 对 歼 慎 体 。 提 高 灵活 性 融 要 存储 各 种 历史 数据 ， 
但 是 一 个 特定 俘 斧 束 要 关联 很 多 表 , 性 能 束 不 能 你 证 ,为 了 解决 这 一 邓 盾 ,数据 仓库 中 束 增 
加 了 数据 集 市 。 数据 集 市 存储 为 特定 用 户 需 求 而 预先 计 算 好 的 数据 ， 从 而 满足 用户 对 性 能 的 
要 求 。 

数据 集 市 产生 的 为 外 一 个 原因 古 数据 仓库 开发 周期 较 长 ， 投 入 较 大 ， 规 模 较 小 的 企业 无 
法 承担 ， 而 数据 集 市 能 够 快速 解决 条 些 问题 ， 而 投资 规模 也 比 数据 仓库 小 很 多 。 

2. 数据 集 市 的 定义 

比尔 。 兰 次 说 过 :“ 如 何 搜集 、 管 理 和 利用 信息 将 决定 您 的 胜 负 。” 商 业 智 能 正 是 在 这 种 
需求 下 诞生 的 ， 而 数据 集 市 是 满足 部 分 特殊 用 户 群 体 用 来 收集 、 管 理 他 们 本 部 门 、 本 专业 信 
县 的 数据 仓库 。 大 多 数 情况 下 ， 数 据 集 市 的 数据 来 源 于 数据 仓库 ， 和 是 一 种 小 型 的 部 门 级 别 的 
数据 人 仓库。 数据 集 市 的 重点 就 是 它 满足 了 茶 些 用 户 的 特殊 业务 怖 求 ， 根 据 所 属 部 门 的 需求 ， 
对 历史 数据 进行 必要 的 汇总 和 计算 。 那 么 什么 是 数据 集 市 ? 数据 集 市 束 是 满足 特定 的 部 
门 或 者 用 户 的 需求 ， 按 照 多维 的 方式 进行 存储 ， 包 括 定 义 维度 、 需 要 计算 的 指标 、 维 度 
的 层次 等 , 生成 面向 决 集 分 析 需 求 的 数据 立方 体 。 数 据 仓库 体系 结构 中 增加 了 数据 集 市 ， 
数据 集 市 可 以 看 做 是 部 门 级 的 小 型 数据 仓库 ， 如 图 2-14 所 示 。 

数据 集 市 


据 转 换 系统 


g- 
L 



















































































数据 集 市 








图 2-14 ”数据 集 市 与 各 系统 之 间 的 关系 
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3. 数据 集 市 的 优点 和 缺点 

数据 集 市 的 优点 : 

投资 规模 小 ， 投 资 回 收 期 相对 较 短 ， 灵 活 ， 风 险 性 较 小 ， 并 且 可 以 按照 多 种 方式 进行 组 
织 ， 例 如 根据 部 门 、 应 用 等 内 容 。 

数据 集 市 的 缺点 : 

(OD 建立 数据 集 市 的 部 门 是 相互 隔离 的 ， 很 多 标准 、 流 程 和 知识 经 验 不 能 共享 ， 这 会 守 
ARER AINN AMERI D) o 

(2) JW ERMER ERRANT, MURER RARA LCH E 
和 便 件 ， 同 时 需要 一 定数 量 的 技术 人 员 。 

(3) 不 同 的 部 门 建设 各 和 目的 数据 集 市 ， 这 些 集 市 乙 间 没 有 数据 的 集成 ， 相 互 独立 ， 因 此 
可 能 会 出 现 数据 不 一 致 的 现象 。 

4. 数据 集 市 分 类 

数据 集 市 的 分 类 包括 : 分 析 产 品类 数据 集 市 、 管 理 分 析 类 数据 集 市 和 研发 类 数据 集 市 。 

(1) 分 析 产 品类 数据 集 市 

分 析 产 品类 数据 集 市 的 定位 是 通过 数据 挖掘 、 建 模 和 其 他 方法 ， 帮 助 企业 发 现 重 要 的 趋 
势 和 规律 ， 以 提高 运 稼 效率 。 

分 析 产 品类 数据 集 市 的 对 象 主要 是 企业 内 部 人 员 。 

分 析 产 品类 数据 集 市 主要 包括 : 文本 分 析 、 模 拟 分 析 、 数 据 挖 据 、 预 测 分 析 、 优 化 分 析 
和 和 可视化 分 析 。 

文本 分 析 : 对 非 结构 化 数据 中 的 文本 进行 分 析 ， 以 提高 业务 洞察 力 。 

模拟 分 析 : 用 先进 的 技术 手段 模拟 流程 、 行 为 和 业务 ， 可 以 帮助 企业 分 析 未 来 业务 的 发 
EJ I8] « 

数据 挖掘 : 数据 挖掘 是 由 专业 人 士 根据 不 同 的 业务 场景 选择 不 同 的 挖掘 算法 ， 通 过 数据 
和 据 探 索 数 据 背 后 隐藏 的 规则 ， 从 而 进行 业务 预测 和 归 类 。 

预测 分 析 : 通过 历史 和 当前 交易 数据 去 分 析 和 预测 未 来 的 业务 能 力 。 

优化 分 析 : 利用 先进 的 数学 技术 ， 玫 助 企 业 提 高 运营 效率 ， 同 时 提供 强大 的 知识 库 。 

可 视 化 分 析 : 通过 图 表 、 地 图 、 日 程 表 和 图 厂 等 ， 利 用 专业 的 工具 分 析 业 务 的 趋势 等 。 

(2) 管理 分 析 类 和 集 市 概述 

管理 分 析 类 集 市 是 指 为 了 运营 管理 的 需要 而 进行 的 数据 整合 分 析 ， 目 的 是 更 好 地 提高 企 
业 的 运营 水 平 。 

管理 分 析 关 集 市 主要 面 问 企业 的 内 部 人 员 ， 一 般 来 说 ， 对 于 数据 的 实时 性 要 求 不 高 。 管 
理 分 析 类 应 用 包括 : 管理 驾驶 舱 、 固 定 报表 、OLAP 分 析 、 绷 效 管理 关键 指标 (KPI 和 质量 
TE^. 

EHAO: 管理 仪表 盘 可 对 企业 领导 层 所 关注 的 经 营 活动 的 关键 指标 做 定制 化 展示 ， 
并 以 直观 的 图 表 形 式 展示 结果 。 

固定 报表 : 以 固化 报表 的 形式 将 手工 报表 目 动 化 生成 。 

OLAP 分 析 : 通过 灵活 的 多 维 分 机 ， 帮 助 企业 决策 者 发 现 问题 ， 退 漳 问 题 根 源 ， 预 测 发 
展 趋 势 等 。 同 时 为 制定 问题 解决 方案 ， 改 善 企 业经 营 状 况 提 供 帮 助 。 

KPI: KPI (Key Performance Indicator) 业务 绩效 管理 关键 指标 。 
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质量 检查 : 按照 业务 需求 定义 数据 质量 检查 规则 ， 按 照 规 则 定期 做 出 数据 质量 分 析 报 告 ， 
提供 给 业务 部 门 ， 以 敦促 报 送 机 构 提高 数据 质量 。 

(3) 研发 集 市 概述 

研发 集 市 主要 是 支撑 企业 各 部 门 的 业务 应 用 系统 ， 满 足 业 务 需要 的 数据 集合 ， 主 要 用 于 
文 持 数 据 研究 分 析 工 作 ; 研发 集 市 同样 也 文 持 各 部 门 的 临时 业务 需求 ， 研 发 集 市 之 间 是 相互 
独立 的 。 

总 结 : 在 架构 中 ， 数 据 集 市 是 基于 数据 仓库 进行 产品 加 工 的 ， 数 据 集 市 的 建设 方式 可 以 
分 成 两 种 模式 ， 即 库 内 数据 集 市 和 库 外 数据 集 市 。 所 谓 库 内 数据 集 市 是 部 署 在 企业 数据 仓库 
之 内 的 ， 在 数据 仓库 汇总 数据 的 基础 上 构建 特定 应 用 的 数据 集 市 ， 库 内 集 市 可 以 共享 仓库 内 
的 汇总 数据 ， 库 外 数据 集 市 是 在 数据 仓库 之 外 单独 部 署 的 ， 具 有 专门 的 软 便 件 设备 ， 数 据 来 
源 可 以 是 数据 仓库 的 基础 层 数 据 或 者 是 汇总 层 的 数据 。 


2.8.2 ”数据 集 市 和 数据 仓库 的 联系 和 区 别 


数据 集 市 和 数据 仓库 的 联系 : 数据 集 市 是 一 组 特定 的 、 针 对 某 个 主题 域 、 某 个 部 门 或 者 
某 些 特殊 用 户 而 进行 分 类 的 数据 集合 ， 也 可 以 说 是 小 型 的 数据 仓库 。 用 户 可 以 在 数据 集 市 中 
快速 地 对 数据 进行 访问 和 展示 报表 ， 同 时 在 数据 结构 的 内 部 对 数据 进行 必要 的 汇总 和 优化 。 
数据 集 市 的 存储 通常 按 照 划 分 主题 的 形式 进行 存放 ,其 模型 一 般 是 星 形 结构 或 者 雪花 形 结构 ， 
而 数据 仓库 除了 按照 主题 的 形式 进行 存放 外 ， 其 模型 一 般 按 照 第 三 范式 的 形式 进行 设计 。 数 
据 仓库 到 数据 集 市 的 过 程 是 从 数据 规范 化 到 多 维 建 模 的 过 程 ， 包 括 将 数据 仓库 内 的 实体 表 转 
化 成 事实 表 、 维 表 ， 以 及 将 实体 之 间 的 关系 转化 成 多 维 关 系 的 映射 。 在 数据 仓库 项 目 中 ， 数 
据 集 市 通常 按照 地 区 、 日 期 等 维度 对 数据 进行 组 织 和 汇总 ， 因 此 数据 仓库 转化 成 数据 集 市 也 
是 按照 轻 量 级 汇总 或 者 中 度 汇总 和 计算 所 完成 的 。 简 而 言 之 ， 数 据 集 市 里 的 数据 一 般 都 是 从 
数据 仓库 中 经 过 转换 、 汇 总 计算 获取 的 ， 和 直接 支撑 前 病 的 应 用 需求 ， 如 图 2-15 所 示 。 数 据 集 
市 的 数据 通常 会 作为 OLAP 服务 和 应 用 服务 的 数据 输入 。 数 据 集 市 的 数据 一 般 不 会 从 源 数据 
系统 中 直接 抽取 ， 即 一 般 不 提倡 建设 独立 型 的 数据 集 市 。 这 是 因为 ， 如 果 数 据 集 市 从 源 数据 
系统 中 直接 抽取 数据 ， 则 可 能 导致 数据 的 不 一 致 性 ， 同 时 也 会 增加 多 个 额外 的 进程 ， 这 些 进 
程 在 源 系 统 中 将 大 大 消耗 系统 的 CPU 资源 ， 从 而 造成 资源 的 浪 绩 。 数 据 集 市 和 数据 仓库 的 关 
系 如 图 2-16 所 示 。 
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图 2-15 数据 集 市 的 数据 来 源 图 2-16 数据 仓库 和 数据 集 市 的 关系 
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数据 集 市 和 数据 仓库 的 区 别 : 数据 仓库 的 数据 是 经 过 整合 和 清洗 的 ， 它 能 够 提供 统一 的 
视图 。 当 数据 仓库 建成 之 后 ， 报 表 、OLAP 应 用 和 数据 分 析 挖 据 都 可 以 从 数据 仓库 中 获取 数 
据 。 对 于 数据 集 市 来 说 ， 它 主要 是 通过 分 析 应 用 的 特点 ， 判 断 应 该 获取 什么 样 的 数据 。 例 如 
市 场 部 的 数据 集 市 可 能 不 需要 人 力 资源 的 数据 。 一 般 来 说 ， 数 据 集 市 就 是 企业 级 数据 仓库 的 
个 子 集 ， 主 要 面向 部 门 级 的 业务 或 者 某 个 特定 的 主题 。 在 数据 结构 上 上， 数据 仓库 是 面 问 主 
题 的 、 集 成 的 数据 的 集合 ， 而 数据 集 市 通 利和 被 定义 为 星 形 结构 或 者 雪人 花形 结构 ， 数 据 集 市 一 
































般 是 由 一 张 事 实 表 和 几 张 维度 表 组 成 的 。 数 据 仓 库 和 数据 集 市 的 数据 结构 如 图 2-17 所 示 。 


数据 仓库 数据 集 市 





图 2-17 数据 仓库 和 数据 集 市 的 数据 结构 
数据 仓库 和 数据 集 市 的 区 别 见 表 2-3。 


表 2-3 数据 仓库 和 数据 集 市 的 区 别 


比较 对 人 象 数据 仓库 数据 集 市 


数据 来 源 ODS 统一 信息 视图 区 数据 仓库 
数据 范围 面向 企业 级 一 般 是 部 门 级 
数据 结构 第 三 范式 雪花 形 或 星 形 结构 


历史 数据 大 量 的 历史 数据 一 部 分 历史 数据 
索引 m BEES mS 


2.8.3 ”数据 集 市 的 目标 分 析 


数据 集 市 主要 是 针对 一 组 特定 的 主题 域 、 部 门 或 者 特殊 用 户 需 求 的 数据 集合 。 这 些 数 据 
需要 针对 用 户 的 快速 访问 和 报表 展示 进行 优化 ， 优 化 的 方式 包括 对 数据 进行 轻 量 级 汇总 ， 在 
数据 结构 的 基础 上 创建 索引 。 数 据 集 市 的 目标 分 析 过 程 包括 对 数据 集 市 的 需求 进行 拆 分 ， 按 
照 不 同 的 业务 规则 进行 组 织 ， 将 与 业务 主题 相关 的 实体 组 织 成 主题 域 ， 并 且 对 各 类 指标 进行 
维度 分 析 ， 从 而 形成 数据 集 市 目标 说 明 书 。 说 明 书 的 内 容 包 括 详细 的 业务 主题 、 业 务 主题 域 
和 各 项 指标 及 其 分 析 维 度 。 

2.8.4 ”数据 集 市 的 技术 特性 

数据 集 市 是 数据 仓库 体系 中 的 一 种 小 型 的 部 门 或 工作 组 级 别 的 数据 仓库 ， 从 而 满足 用 户 
对 性 能 的 需求 。 数 据 集 市 在 一 定 程度 上 可 以 绥 解 访问 数据 仓库 的 瓶 供 。 根 据 数 据 集 市 应 用 的 
不 同 ， 可 以 分 成 库 内 集 市 或 库 外 集 市 ， 数 据 集 市 拉 术 路 线 的 指导 原则 包括 : 

CD. 大 规模 并 行 处 理 能 
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(2) ZPE es ER CREER 

(3) 存储 压缩 

(4) 汇总 表 快 速 刷 新 

数据 集 市 的 技术 特性 应 该 包括 : 对 海量 数据 的 处 理 能 力 、 线 性 扩展 的 能 力 、 工 作 负 载 管 
理 的 能 力 、 高 可 用 性 、 数 据 压 缩 、 高 速 数据 加 载 和 蔓 载 能 力 、 星 形 模 型 和 雪人 花 模 型 性 能 优化 、 
物化 售 询 即时 更 新 和 满足 数据 库 平 侣 需求 的 能 

1. 海量 效 据 处 理 能 

数据 集 市 和 数据 仓库 的 区 别 在 于 数据 的 范围 和 主题 ， 数 据 仓 库 是 全 局 的 整体 的 数据 ， 数 
据 集 市 主要 服务 于 特定 主题 ， 在 茶 些 时 候 ， 数 据 集 市 的 数据 量 也 很 大 ， 所 以 集 市 也 需要 有 处 
理 大 并 发 、 复 杂 得 询 的 能 

2. 线性 扩展 能 

数据 集 市 平台 应 该 满足 线性 扩展 的 能 力 ， 并 且 能 够 应 对 数据 的 不 断 增 长 。 

3. 工作 负载 管理 能 

提供 工作 负载 管理 能 

4. 高 可 用 性 

数据 集 市 平台 可 以 提供 高 可 用 的 方案 ， 满 足 系统 的 高 可 用 性 要 求 。 

S. SAUL a 

必须 提供 民 好 的 数据 压缩 能 力 ， 降 低 存储 成 本 ， 多 段 备 份 和 恢复 时 间 ， 满 足 系 统 的 时 间 
要 求 。 

6. 高速 数据 加 载 和 卸载 能 

必须 提供 高 速 的 数据 加 载 和 蔓 载 能 力 ， 以 保证 数据 加 载 和 番 载 能 够 在 较 短 的 时 间 内 完 
成 ， 从 而 减轻 运 维 压力 。 

7. 星 形 模 型 /雪花 模型 性 能 优化 

一 般 来 说 ， 数 据 集 市 中 的 数据 ， 通 常 按照 星 形 和 雪花 模型 组 织 ， 数 据 集 市 平台 必须 提供 
针对 性 的 优化 ， 以 满足 用 户 啊 应 时 间 的 要 求 。 

8. 物化 查询 即时 更 新 

数据 集 市 中 通常 使 用 物化 查询 来 优化 查询 速 上 度 ， 对 于 时 效 性 要 求 较 高 的 数据 ， 会 采用 实 
时 或 者 较 短 的 周期 完成 对 数据 的 更 独 ， 提 供 快 速 的 物化 查询 能 力 来 保障 时 效 性 。 

9. 满足 数据 库 平 台 需 求 的 能 

数据 集 市 平台 本 喘 是 一 个 数据 库 平 台 ， 除 了 满足 数据 集 市 的 特殊 需求 外 ， 还 必须 满足 数 
据 库 平台 全 部 功能 。 
























































2.0 ”0Ds 介绍 


29.4 ODS 的 概述 


1. ODS 的 概念 
ODS 是 操作 数据 存储 的 缩写 ， 丙 文人 全称 为 Operational Data Store。 通 过 前 面 的 学 习 ， 我 们 
己 经 知道 数据 仓库 是 一 个 面 同 主 题 、 集 成 、 相 对 稳定 、 有 反映 历史 变化 的 数据 集合 ， 用 于 支持 
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用 户 的 辅助 决策 分 析 。 而 ODS 则 是 一 个 面 癌 主题 的 、 集 成 的 、 可 变 的 、 反 有 映 当 前 细节 的 数据 
集合 。 它 主要 用 于 文 持 企业 处 理 业务 应 用 和 存储 面 问 主题 的 、 即 时 性 的 集成 数据 ， 为 企业 决 
策 者 提供 当前 细节 性 的 数据 ， 通 铝 作 为 数据 仓库 的 过 湾 阶 段 。 

2. ODS 建设 原因 

ODS 系统 建设 的 原因 有 多 种 ， 主 要 原因 有 : 

CD 系统 重复 开 友 ， 造 成 资源 极度 浪 绩 ， 因 为 不 同 应 用 之 间 ， 可 能 存在 相同 的 数据 抽取 
需求 ,但 是 这 些 应 用 系统 如 果 都 是 下 接 从 源 系 统 中 获取 数据 , 那么 他 们 会 开发 相同 功能 的 ETL 
程序 ， 这 样 源 系统 经 过 多 次 抽取 ， 不 仪 会 浪费 网 络 存 储 资 源 ， 还 会 造成 不 同 应 用 系统 之 间 数 
据 的 不 一 致 性 ， 同 时 会 造成 业务 源 系统 沉重 的 压力 。 

(2) 一 般 来 说 ， 业 务 部 门 需要 的 信息 可 能 来 目 于 多 个 系统 ， 但 是 由 于 各 个 系统 之 间 的 数 
据 可 能 会 出 现 口径 不 一 致 ， 数 据 不 规范 的 现象 ， 因 此 大 大 增加 了 临时 抽取 数据 的 难度 ， 同 时 
很 难保 证 数据 的 一 致 性 和 准确 性 。 

Zk Ln, inb ODS 系统 的 建设 ， 不仅 可 以 大 大 缩短 应 用 系统 的 实施 路 径 ， 减 少 重复 性 
的 设计 和 开发 ， 还 可 以 提高 数据 的 啊 应 速度 和 准确 性 ， 为 以 后 的 数据 挖掘 和 分 析 打 下 基础 。 

3. ODS 的 特点 

业务 数据 经 过 ETL 数据 抽取 、 转 换 、 加 载 进 入 到 ODS 系统 中 ， 为 企业 提供 了 一 种 全 局 
的 ， 集 成 的 和 反映 当前 实时 性 的 视角 ， 在 文 持 企业 决策 分 析 需 求 的 同时 ， 还 能 够 在 业务 系统 
和 数据 仓库 之 间 构 建 一 个 数据 绥 冲 市 ， 使 得 数据 之 间 的 传输 和 转换 变 得 相对 容易 。ODS 系统 
的 主要 功能 就 是 将 多 个 业务 系统 中 不 同 的 数据 源 进行 数据 集成 ， 通 过 数据 抽取 、 转 换 、 加 载 
将 数据 放 入 到 共享 的 存储 区 中 ， 以 保证 数据 的 一 致 性 。ODS 具有 以 下 特点 : 

D 数据 是 不 断 更 新 和 易 丢 失 的 ， 当 新 的 业务 数据 进入 到 ODS 时 ， 旧 的 数据 会 被 新 数据 
禾 辣 或 者 更 新 ， 一 般 不 存储 历史 数据 ， 只 反映 当前 实时 性 的 信息 。 

2) ODS 系统 一 般 存 储 的 都 是 细 市 性 的 信息 ， 很 少 有 汇总 的 数据 ， 即 ODS 包含 粒度 级 别 




































































最 低 的 数据 。 
3) ODS 系统 文 持 快 速 的 数据 更 狐 操 作 ， 数 据 刷 狐 频 紊 很 快 ， 一 般 不 你 存 过 期 的 历史 
数据 。 





4) ODS 系统 一 般 存 储 在 关系 数据 库 中 ， 通 过 将 各 个 业务 系统 的 数据 集成 起 来 ， 组 成 企 
业 的 全 局 统一 性 视图 ， 实 现 ODS 的 数据 共享 功能 。 

5) 用 户 可 以 频繁 访问 ODS 系统 ， 因 为 它 是 基于 操作 型 应 用 的 。 

4. ODS 设计 原则 

ODS 的 设计 原则 包括 可 扩展 性 、 高 可 用 性 、 可 重用 性 和 高 性 能 。 

(1) 可 扩展 性 

可 扩展 性 是 指 ODS 系统 可 以 文 持 业 务 系统 扩展 的 需要 。 举 例 来 说 ， 设 计 ODS 数据 模型 
的 时 候 ， 应 该 充分 考虑 新 旧 系 统 的 业务 数据 模型 能 够 扩展 到 ODS 系统 中 。 

(2) 高 可 用 性 

高 可 用 性 是 指 系统 发 生变 化 的 时 候 ， 可 以 依赖 架构 的 灵活 性 ， 仍 能 保证 系统 的 正常 运行 ， 
例如 对 于 模型 的 设计 应 该 考虑 业务 源 系统 结构 友 生 变化 对 ODS 系统 市 来 的 影响 。 也 残 是 说 局 
部 模型 的 扩展 不 会 影响 到 ODS 数据 模型 。 
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(3) 可 重用 性 

可 重用 性 是 指 尽量 避免 系统 建设 的 重复 ， 尽 可 能 的 考虑 物理 设备 、 系 统 软件 、 模 型 以 及 
应 用 上 的 复 用 。 举 例 来 说 ， 对 于 ETL 处 理 流 程 ， 应 分 析 ETL 任务 的 各 个 环节 ， 找 出 公共 的 组 
件 ， 进 行 封装 ， 然 后 进行 复 用 。 

(4) 高 性 能 

局 性 能 是 指 ODS 系统 可 以 承受 峰值 时 的 系统 压力 和 更 多 的 应 用 ， 保 证 系统 可 以 正常 运行 。 

5. ODS 的 主要 功能 

ODS 的 主要 功能 如 图 2-18 所 示 。 


























作为 业务 系 
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为 企业 提供 
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图 和 数据 共 
享 的 功能 


降低 业务 


eii 系统 的 压力 














ODS 的 

主要 功能 
5 满足 从 微观 
检查 数据 we 
质量 的 功能 ~ 角度 查询 细节 


数据 的 要 求 





实时 性 的 数 
据 整 合 功能 





图 2-18 ODS 的 主要 功能 


D 作为 业务 系统 和 数据 仓库 之 间 的 隅 离 地 带 

一 般 来 说 ， 数 据 仓 库 系统 的 数据 来 源 非常 复杂 ， 数 据 可 能 存储 在 不 同 的 应 用 系统 和 业务 
数据 库 中 ， 为 了 满足 数据 仓库 对 业务 数据 的 抽取 标准 ， 需 要 在 应 用 系统 和 数据 仓库 系统 之 间 
建立 一 个 隅 离 墙 ， 如 图 2-19 所 示 。ODS 系统 作为 阳 离 载 的 目的 古 临 时 存储 多 个 业务 源 数据 ， 
经 过 一 系列 的 清洗 、 转 换 达 到 数据 仓库 对 数据 的 要 求 后 ， 再 将 数据 加 载 到 数据 仓库 中 。 








WMR 


AN 
ey 





图 2-19 ODS 的 隔离 墙 功能 
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在 业务 系统 中 直接 将 数据 抽取 到 数据 仓库 中 并 不 容易 ，ODS 系统 作为 业务 系统 和 数据 仓 
库 系 统 之 间 的 隅 离 地 市 ， 用 于 存放 从 业务 系统 抽取 出 来 的 数据 ， 为 数据 仓库 提供 了 平整 、 可 
AE HIZEY o 

(2) 降低 业务 系统 的 压力 

在 数据 仓库 建立 之 前 ， 大 量 的 决 休 分析 报表 是 由 业务 系统 直接 生成 的 ， 在 报表 生成 过 程 
中 可 能 存在 复杂 的 计算 ， 对 业务 系统 的 运行 产生 非常 大 的 压力 。 在 建立 ODS 系统 之 后 ， 原 来 
由 业务 系统 二 接 产 生 的 复杂 报表 、 对 细 世 数据 的 得 询 者 能 够 在 ODS 系统 中 进行 ， 从 而 有 效 降 
低 了 业务 系统 的 得 询 压 力 ， 提 高 了 业务 系统 的 运行 效率 。 

(3) 满足 从 微观 角度 得 询 细 节 数 据 的 要 求 

一 般 来 说 ， 在 数据 仓库 体系 结构 中 ， 数 据 仓 库 层 存储 的 数据 都 是 经 过 轻 度 汇总 的 数据 和 
历史 数据 ， 几 乎 不 存储 任何 生产 运营 过 程 中 产生 的 细 市 数据 。 但 是 ， 为 了 满足 特殊 用 户 群 体 
的 要 求 ， 可 能 需要 对 一 些 交 易 数据 进行 得 询 ， 这 时 需要 把 奉 询 这 些 交 易 数据 的 功能 让 ODS 系 
RKKA. WE, ODS 系统 文 持 多 维 分 析 的 功能 ， 因 为 它 也 是 面 加 主题 的 、 集 成 的 系统 。 数 
据 仓 库 从 宏观 上 支持 多 维 决策 分 析 ， 而 ODS 系统 从 微观 角度 描述 细节 性 的 数据 查询 。 

(4) 实时 性 的 数据 整合 功能 

ODS 系统 共有 实时 性 的 数据 整合 功能 。 它 通过 ETL 技术 , 实时 地 从 各 个 业务 系统 中 抽取 
企业 的 运营 交易 数据 ， 通 过 数据 转换 、 清 洗 、 加 载 等 操作 最 终 形成 共 至 数据 ， 为 企业 提供 统 
一 的 数据 视 独 。 这 种 数据 整合 功能 有 助 于 提高 数据 的 一 致 性 ， 为 数据 仓库 提供 优质 的 数据 源 。 

(50 检查 数据 质量 功能 

ODS 系统 具有 完善 的 数据 质量 检查 功能 。 它 通过 对 企业 数据 的 质量 检 丛 和 质量 评 佑 ， 完 
善 企业 内 部 的 组 织 机 构 ， 文 持 对 数据 质量 管理 流程 的 监控 ， 

—— 


从 而 实现 对 源 数 据 质量 问题 的 发 现 和 修正 。 

C60 为 企业 提供 统一 的 数据 视图 和 数据 共享 功能 

ODS 系统 为 企业 提供 了 统一 的 数据 视图 和 数据 共享 功 
能 。 它 通过 对 各 个 业务 系统 运 维 数据 的 集成 ， 实 现 ODS 的 数 
据 共享 ， 同 时 为 企业 提供 全 局 的 统一 数据 视图 。 

6. ODS 的 设计 步骤 

ODS 的 设计 步 缀 ( 见 图 2-20)〉 w F: 

(1) 数据 调研 

数据 调研 主要 是 根据 业务 人 员 提供 的 需求 意向 ， 将 业务 ”图 220 ODS SU EGER S 
系统 划分 成 几 个 模块 ， 并 对 各 个 模块 所 涉及 的 数据 和 数据 源 进 行 调研 分 机 。 数 据 调研 分 析 可 
以 分 成 编写、 模块 名 称 、 数 据 来 源 〈 包 括 导 入 和 输入 )、 备 注 等 信息 ， 见 表 2-4。 


表 2-4 数据 调研 分 析 表 
数据 来 源 备 d 
编 号 模块 名 称 


l 生产 数据 


KK KK K K KK KK KK 


i ni 
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(2) 确定 数据 范围 

确定 数据 范围 是 在 需求 调研 的 基础 上 进行 的 。 为 了 保证 所 需 的 数据 都 能 够 从 业务 系统 中 
得 到 ， 需 要 将 应 用 需求 与 ODS 的 数据 范围 结合 起 来 ， 也 就 是 对 ODS 进行 主题 的 划分 。 通 常 
来 说 ，ODS 主题 的 划分 是 以 企业 的 业务 模型 为 基础 ， 通 过 参考 各 种 业务 系统 信息 模型 ， 得 到 
ODS 数据 主题 的 范围 ， 根 据 该 范围 进行 ODS 主题 的 定义 ， 从 而 确定 ODS 的 数据 范围 。 

(3) 设计 主题 元 素 

ODS 系统 的 主题 元 素 主 要 包括 主题 名 称 、 维 度 、 度 量 值 、 粒 度 、 存 储 的 时 间 。 下 面 进 行 
详细 的 介绍 。 

e 主题 名 称 : 说 明 该 主题 主要 包含 哪些 分 析 数 据 ， 用 户 重点 关注 的 对 象 是 什么 。 

e 维度 : 说 明 数 据 分 析 时 的 角度 有 哪些 ， 例 如 时 间 维 度 的 年 、 季 、 月 、 日 等 。 

e 度量 值 : 说 明 用 户 关 注 的 指标 值 ， 例 如 工资 额 、 销 售 量 等 。 

e WE: 是 指 对 数据 的 细 化 程度 。 一 般 来 说 ， 细 化 程度 越 高 ， 粒 度 级 别 束 越 小 ， 细 化 程 

ERIR, MERIK. 

e 存储 的 时 间 : 主要 描述 数据 的 存储 周期 和 存储 期 限 是 多 少 。 

(4) ODS 系统 的 物理 实现 

ODS 系统 的 物理 实现 主要 包括 : 数据 库 的 物理 实现 ， 数 据 抽 取 的 设计 等 内 容 。 


2.9.2 ODS 系统 与 数据 库 系 统 、 数 据 仓库 系统 的 区 别 


ODS 系统 是 既 不 同 于 一 般 的 数据 库 系 统 ， 又 不 同 于 数据 仓库 系统 的 一 种 特殊 的 数据 存储 
系统 。 它 与 一 般 数 据 库 有 很 多 区 别 ， 它 的 数据 组 织 方式 是 面向 主题 的 、 集 成 的 ， 而 数据 库 系 
统 则 是 面 癌 应 用 和 事务 处 理 的 。ODS 系统 与 数据 仓库 系统 相 比 不 同 的 是 ， 它 只 存储 当前 的 、 
细节 性 的 信息 或 者 接近 当前 的 实时 性 数据 ， 它 可 以 对 数据 进行 增加 、 删 除 和 修改 等 操作 ， 而 
数据 仓库 系统 是 面 癌 主题 和 集成 的 ， 但 是 一 般 不 进行 数据 修改 ， 并 且 它 还 存储 大 量 的 历史 数 
Hio ODS 系统 和 数据 仓库 系统 的 主要 区 别 体现 在 数据 的 时 间 性 、 稳 定性 、 可 修改 性 、 细 记性 
和 用 户 访问 频率 上 。 

ODS 系统 与 数据 库 系 统 、 数 据 仓 库 系 统 的 区 别 如 图 2-21 所 示 。 


数据 库 系统 数据 仓库 系统 


。 面 器 应 用 、 事 务 处 理 。 面向 主题 、 集 成 的 e 面向 主题 、 集 成 的 
。 实 时 性 高 。 实 时 性 要 求 高 。 实 时 性 要 求 不 高 

。 数 据 检索 量 小 。 数 据 检索 量 小 。 数 据 检 索 量 大 

。 只 存储 当前 数据 。 一 般 只 保留 当前 数据 。 存储 大 量 历史 数据 和 
e 访问 频率 高 e 访问 频率 高 轻 度 汇总 的 数据 

e 响应 时 间 控 制 到 1s “响应 时 间 控制 到 1s 。 访问 频率 中 、 低 
LAN 以 下 e 响应 时 间 需 儿 秒 或 者 










































































* 用户 数 量 大 * 用 户 数量 相对 较 小 更 长 
。 用户 数 量 相 对 较 小 





图 2-21 ODS 系统 与 数据 库 系统 、 数 据 仓库 系统 的 区 列 


(1) ODS 系统 与 数据 仓库 的 区 别 
1) ODS 系统 是 业务 数据 进入 到 数据 仓库 系统 中 的 一 段 临时 存储 区 域 ， 用 于 存储 当前 或 
者 接近 当前 的 实时 性 数据 ， 而 数据 仓库 一 般 只 存储 历史 数据 。 
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2) ODS 系统 对 数据 的 更 新 是 频 索 的 ， 而 数据 仓库 中 的 数据 是 不 能 更 新 的 ， 数 据 的 任何 
变化 都 应 该 反映 到 数据 仓库 中 。 

3) ODS 系统 主要 存储 细节 性 的 数据 ， 而 数据 仓库 系统 既 包 含 细 区 性 的 历史 数据 ， 同 时 
也 包含 轻 度 汇总 的 数据 。 

(2) ODS 系统 与 数据 库 的 区 别 

10 数据 库 系 统 主要 是 面 癌 事物 处 理 和 应 用 的 ， 而 ODS 系统 主要 是 面 癌 主题 、 集 成 的 。 

2) 数据 库 系统 的 用 户 量 相 对 较 大 ， 而 ODS 系统 面 对 的 用 户 数量 相对 较 小 。 


29.3 ”基于 ODS 和 基于 数据 仓库 的 OLAP 之 间 的 关系 


建立 基于 ODS 系统 的 即时 OLAP 应 用 是 建立 决策 分 析 的 一 种 解决 方案 , 通 第 应 用 于 中 低 
级 别 的 决策 分 析 应 用 。 建 立 基于 数据 仓库 的 OLAP 


应 用 是 为 了 进行 长 期 的 趋势 分 析 ， 但 是 一 般 运行 较 。“” [于 0Ds Wf] [Eramo 
慢 。 如 果 企业 决策 者 需要 查看 周期 时 间 较 短 的 一 些 OLAP H | |BIBOLAP 应 用 


站 标 情 况 ， 则 不 十 要 太 多 的 历史 数据 ， 这 样 束 需 要 t ERRANA * ERRIA 















































l 统 的 一 种 解决 统 的 一 种 解决 
建立 基于 ODS 的 即时 OLAP 应 用 。 例如 ， 查 看 一 周 AN »* 
> gm 又 销售 情况 ， 只 需要 参考 当前 时 间 内 一 。 满 足 日 常 频 繁 。 满 足 长 期 趋势 
之 内 的 各 地 区 销售 情况 ， 上 只 需要 参考 当前 时 间 内 Pe 











周 的 历史 数据 ， 如 有 条 在 数据 仓库 中 建立 即时 OLAP 。 运行 时 间 较 短 。 运行 时 间 较 长 
应 用 ， 运 行 效率 非常 低 ， 并 且 很 难 准确 地 反映 当前 

时 间 的 各 地 区 销售 情况 。 基 于 ODS 和 基于 数据 仓 。 202 3T ODS 和 基于 数据 仓 亩 的 
库 的 OLAP 之 间 的 天 系 如 图 2-22 所 示 。 OLAP 之 间 的 关系 


2.9.4 ODS 系统 的 功能 


一 般 来 说 ， 在 数据 仓库 系统 中 ， 存 储 的 数据 都 是 轻 度 汇总 的 指标 数据 或 者 历史 数据 ， 很 
少 有 细节 性 的 、 当 前 的 生产 运营 数据 ， 但 是 在 特殊 的 应 用 中 ， 用 户 可 能 会 对 这 些 生产 数据 进 
行 查询 ， 而 数据 仓库 不 支持 这 些 特殊 的 查询 ， 这 部 分 功能 可 以 由 ODS 系统 来 实现 。 

ODS 系统 不 仅 可 以 支持 多 维 分 析 等 查询 功能 ， 还 可 以 满足 对 细节 性 的 交易 数据 或 者 粒度 
级 别 很 低 的 数据 进行 查询 。 因 为 ODS 系统 是 按照 面向 主题 的 方式 进行 数据 存储 ， 同 时 它 又 只 
存储 当前 时 间 段 内 的 或 者 接近 当前 的 细节 性 数据 。ODS 系统 的 数据 组 织 方式 是 基于 主题 的 ， 
它 对 所 有 业务 系统 的 数据 进行 集成 ， 组 成 全 局 共享 的 数据 视图 。ODS 系统 的 另 一 个 重要 功能 
就 是 数据 共享 的 功能 ， 它 的 数据 存储 量 取 决 于 对 业务 数据 的 抽取 频率 。ODS 系统 的 数据 具有 
交互 功能 , 不 仅 提供 企业 的 全 局 信息 统一 视图 ,满足 对 
言 息 共享 的 需求 , 同时 还 可 以 在 固定 的 周期 内 ,实现 决 
策 分 析 系 统 与 其 他 业务 系统 之 间 的 交互 。 当 ODS 系统 “| 细节 、 低 粒度 | ”数据 共享 | ”数据 交互 
的 数据 有 更 新 时 , 外 围 的 业务 系统 数据 也 会 发 生 相 应 的 “| CEDERE) 
变化 。ODS 系统 的 功能 如 图 2-23 所 示 。 

Mii: ODS 系统 是 一 个 面 问 主 题 的 、 集 成 的 、 当 图 2-23 ODS 系统 的 功能 
前 的 、 可 更 新 的 数据 集合 , 用 于 细节 性 的 查询 和 为 决策 
分 析 系 统 提供 当前 时 间 段 内 的 数据 。ODS 系统 是 介 于 操作 型 数据 库 和 数据 仓库 之 间 的 一 种 存 
储 方式 ， 数 据 仓库 存储 的 是 轻 度 汇总 的 数据 或 历史 数据 ，ODS 系统 存储 的 是 细节 性 数据 和 当 


了 3 















































ODS 系统 的 功能 

















前 时 间 段 内 的 数据 。 数 据 仓库 系统 和 ODS 系统 的 结合 能 够 分 析 企 业 当 前 的 运营 情况 ， 同 时 对 
未 来 企业 的 经 营 状况 进行 合理 的 规划 和 分 析 。ODS 系统 中 的 数据 可 以 进行 增加 、 删 除 、 修 改 
等 操作 ， 但 是 数据 仓库 中 的 数据 一 般 不 能 进行 修改 。 数 据 仓库 系统 与 业务 系统 相隔 离 ， 目 的 














是 减少 数据 仓库 的 处 理 和 决策 文 持 分 析 对 业务 系统 造成 的 影响 ， 减 少 业 务 系统 的 压力 。 
29.5 ODS 系统 的 架构 


ODS 系统 的 架构 如 图 2-24 PTR o 
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ODS 使 用 人 员 应 用 系统 


主题 分 析 层 





各 业务 系统 


图 2-24 ODS 系统 的 架构 


210 ”数据 仓库 实施 详细 步 又 


2.10.1 需求 分 析 


需求 分 析 是 数据 仓库 项 目 最 重要 的 一 个 环节 ， 如 果 需 求 分 析 不 准确 ， 会 直接 影响 客户 的 
使 用 ， 最 终 导 致 商业 智能 项 目的 失败 。 为 了 避免 最 坏 的 情况 ， 将 采取 以 下 措施 和 方法 去 完善 
需求 分 析 。 

D 尽 可 能 与 客户 一 起 分 析 需 求 ， 引 导 客 户 将 项 目 所 要 实现 的 整体 框架 和 业务 细节 部 分 措 
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述 清 楚 ， 最 佳 途 径 就 是 需求 人 员 和 设计 人 员 通 过 诛 型 与 客户 讨论 ， 从 而 正确 理解 客户 实际 的 
业务 需求 。 








2) 必须 实事 求 是 地 将 数据 仓库 所 能 实现 的 目标 和 不 容易 解决 的 问题 与 客户 界 协商 请 楚 ， 
每 一 步 的 需求 都 需要 和 客户 进 行 签 字 人 确认 。 

在 需求 讨论 的 基础 上 ， 和 需要 理解 客户 的 业务 工作 流程 ， 当 然 如 来 我 们 已 经 在 这 一 行业 中 
积 囚 了 丰富 的 业务 知识 ， 同 时 具备 了 引导 客户 的 能 力 ， 那 残 可 以 在 需求 调研 的 时 候 尽 可 能 地 
让 客户 按照 目 己 的 思路 去 完成 数据 仓库 系统 的 功能 设计 。 根 据 商业 智能 项 目的 特点 ， 可 以 将 
客户 分 成 以 下 几 类 : 数据 俘 询 客户 、 报 表 合 询 客 尸 、 企 业 决 俩 者 ， 通 过 与 他 们 的 沟通 交流 ， 
帮助 客户 理 清 思 路 ， 尺 可 能 获知 他 们 的 需求 信息 ， 同 时 需要 对 客户 讲解 数据 仓库 的 框 染 知识 ， 
包括 数据 仓库 的 概念 ， 数 据 仓 库 系 统 能 解决 什么 问题 ， 数 据 仓库 和 一 般 的 应 用 系统 有 什么 区 
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别 。 最 好 将 以 前 成 功 的 商业 智能 项 目 讲解 给 客户 ， 使 客户 理解 处 理 当前 数据 需要 的 时 间 周 期 ， 
系统 可 以 文 持 的 客户 访问 量 、 报 表格 式 和 展示 方式 等 内 容 。 在 此 基础 上 ， 可 以 完成 商业 智能 
项 目 整 体 的 规划 和 对 每 一 个 开发 阶段 的 清晰 界定 。 最 后 需要 跟 客户 沟通 的 是 在 对 数据 准确 性 
的 校 验 上 ， 在 现 有 的 客观 条 件 下 ， 所 能 保证 的 数据 仓库 系统 在 抽取 、 消 洗 、 转 换 过 程 中 允许 
RILIR, WK 2-25 所 示 。 

商业 智能 决策 分 析 系 统 的 实际 需求 通常 并 不 确定 ， 因 为 需求 不 断 地 发 生变 化 ， 这 无 形 中 
增加 了 设计 者 理解 客户 实际 需求 的 难度 。 一 般 情 况 下 ， 和 客户 能 够 提供 的 都 是 需求 的 整体 框 淋 
部 分 或 者 是 实际 需求 的 一 部 分 内 容 ， 不 能 预 抑 未 来 需要 增加 的 需求 ， 这 也 注定 了 商业 智能 决 
末 分 析 系 统 的 开 肥 是 一 个 不 断 人 循环 、 反 馈 ， 使 系统 不 断 完 善 增长 的 过 程 。 同 时 ， 为 了 最 大 限 
度 地 减少 需求 变更 ， 我 们 在 需求 采集 的 过 程 中 制订 出 详细 的 调研 计划 ， 采 用 切实 可 行 的 调研 
方式 跟 客 户 沟通 和 交流 ， 从 而 了 解 客户 最 真实 的 需求 。 其 中 最 香 见 的 调研 方式 就 是 问 疮 调查 、 
会 议 调研 或 者 电话 沟通 等 ， 如 网 2-26 所 示 。 我 们 需要 充分 利用 调研 的 宝 吐 时 间 和 一 切 资源 ， 
充分 了 解 企 业 不 同 层面 的 各 类 人 员 的 实际 需求 。 当 需求 调研 完成 时 ， 需 要 对 采集 结束 进行 分 
析 、 归 纳 、 整 理 ， 最 终 形成 完整 的 需求 分 析 报 告 。 


" 对 客户 讲解 数 

对 客户 进行 CN | 据 仓库 的 框架 
知识 

完成 商业 智能 

(| 项 目 整体 的 
规划 


图 2-25 完善 需求 分 析 的 方法 图 2-26 管见 的 调研 方式 


业务 需求 的 实施 目的 束 是 真正 理解 企业 决策 者 的 战略 性 目标 。 在 理解 建立 商业 智能 系统 目 
标的 基础 上 ， 建 立 有 效 的 企业 管理 模式 ， 制 定 出 详细 的 企业 数据 仓 库 业 务 管理 规范 ， 设 计 出 锦 
用 的 ETL 数据 采集 规范 和 工作 流程 ， 从 而 明确 商业 智能 系统 的 实施 范围 和 目标 。 为 了 提高 企业 
FA POCHE JJ. 可 以 利用 当下 的 局 域 网 技术 和 互联 网 技术 实现 企业 对 各 种 信息 的 得 询 和 分 析 ， 
通过 建立 企业 业务 数据 模型 ， 分 析 商 业 智 能 系统 的 系统 架构 、 数 据 源 之 间 的 差异 、 对 数据 质量 
的 评 佑 和 各 种 信息 的 处 理 方 法 ， 有 效 地 提高 企业 商业 智能 系统 的 分 析 和 决 全 能 力 。 


2.10.2 ”数据 仓库 的 人 逻辑 分 析 

数据 仓库 在 逻辑 上 可 以 分 成 操作 型 数据 库 、 数 据 仓 库 层 、 数 据 集 市 层 、 数 据 分 析 应 用 层 
和 报表 展示 层 ， 如 图 2-27 所 示 。 
2.10.3 ”设计 ODS 系统 


ODS 可 以 有 两 种 形式 ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 .。 
(D ODS 数据 缓冲 区 
ODS 数据 缓冲 区 是 业务 数据 流动 过 程 的 第 一 个 存储 区 ， 实 现 了 数据 仓库 从 各 个 业务 系统 
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的 数据 源 中 将 数据 抽取 出 来 ， 并 且 装 载 到 ODS 数据 绥 冲 区 的 这 一 过 程 ， 从 而 实现 统一 的 、 全 
局 的 企业 数据 平台 ， 为 以 后 的 数据 抽取 、 清 洗 、 转 换 过 程 打 下 了 坚实 的 基础 。 对 于 数据 量 大 
的 数据 源 可 以 采用 增 量 的 方式 进行 抽取 ， 对 于 经 常 变 化 更 新 的 数据 一 般 采 用 全 量 的 方式 进行 











集成 起 来 ， 组 成 统一 的 、 全 局 的 企业 数据 交换 平台 。ODS 数据 缓冲 区 与 业务 数据 的 关系 如 
图 2-28 所 示 。 





S. 


RETI 


图 2-27 数据 仓库 的 逻辑 框架 结构 


ODS 数据 缓冲 区 





图 2-28 ODS 数据 缓冲 区 与 业务 数据 的 关系 





(2) ODS 统一 信息 视图 区 

ODS 统一 信息 视图 区 是 指 有 选择 地 集成 各 类 业务 源 数据 ， 对 数据 进行 抽取 、 清 洗 、 转 换 
操作 ， 以 数据 主题 域 为 数据 集成 的 基础 ， 对 数据 进行 分 类 和 组 织 ， 使 用 户 能 够 通过 统一 信息 
视图 区 获得 跟 某 个 主题 域 相关 的 实时 性 数据 。 各 业务 系统 和 ODS 统一 信息 视图 区 可 以 互相 访 
问 ， 可 以 生成 具有 实时 性 的 操作 性 报表 和 查询 某 一 主题 的 近期 全 部 信息 。ODS 统一 信息 视图 





























36 








区 与 各 业务 系统 之 间 的 关系 如 图 2-29 所 示 。 


个 | IR 

各 个 业务 系统 ODS 统一 信息 视图 区 
了 本 
El H 















图 2-29 ODS 统一 信息 视图 区 与 各 业务 系统 之 间 的 关系 














(3) ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 的 区 别 和 共同 点 

ODS 数据 绥 冲 区 主要 为 业务 源 数据 抽取 到 数据 仓库 中 提供 中 间 数 据 绥 冲 的 功能 ， 与 
ODS 统一 信息 视图 区 最 大 的 区 别 束 是 数据 抽取 、 清 洗 、 转 换 、 加 载 的 转换 规则 和 数据 存储 
的 方式 不 同 。ODS 统一 信息 视图 区 是 完全 按照 主题 的 方式 进行 数据 存储 ， 回 用 户 提供 快速 
的 报表 展示 和 数据 实时 查询 的 功能 ,而 ODS 数据 绥 冲 区 的 ETL 规则 一 般 只 进行 简单 的 汇总 、 
计算 ， 或 者 从 操作 型 数据 库 中 直接 抽取 而 中 间 不 进行 任何 转化 。ODS 统一 信息 视图 区 的 数 
据 一 般 都 是 从 ODS 数据 缓冲 区 中 抽取 过 来 的 。ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 如 
图 2-30 所 示 。 



































ODS 数 据 缓冲 区 ODS 统 一 信息 视图 区 


转换 、 映 射 、 


清洗 、 加 载 | 


图 2-30 ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 
2.40.4 ”数据 仓库 建 模 


数据 仓库 建 模 在 前 面 已 经 有 了 详细 的 介绍 ， 数 据 仓库 棕 型 是 IT 技术 开发 人 员 、 业 务 
人 人员、 决策 管理 者 相互 沟通 的 一 套 语言 和 平台 。 对 于 数据 建 模 工 程 师 来 说 ， 对 业务 的 深刻 
理解 是 首要 任务 ， 因 为 数据 仓库 建 模 分 为 概念 模型 设计 、 池 和 辑 模 型 设计 和 物理 模型 设计 3 
个 阶段 ， 一 般 按 照 目 顶岗 下 的 顺序 依次 对 模型 进行 设计 。 概 念 模型 主要 是 便 型 设计 人 员 对 
业务 规则 的 理解 , 是 最 高 层次 的 数据 模型 , 几乎 涵盖 了 业务 所 有 的 核心 概念 和 重要 的 主题 ， 
为 以 后 逻辑 模型 的 建设 打下 了 基础 。 逻 辑 模型 是 对 概念 模型 的 分 解 、 细 化 ， 将 数据 主题 划 
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分 成 一 个 个 的 实体 和 实体 关系 ， 一般 将 第 三 范式 作为 设计 的 模板 。 物 理 模型 在 逻辑 模型 的 
基础 上 对 模型 实体 进行 细 市 性 的 描述 ， 包 括 凶 段 类 型 、 长 度 、 索 引 等 因素 ， 最 后 转化 成 数 
据 库 存储 的 物理 表 。 


2.0.5 ”数据 集 市 建 模 


一 般 数 据 集 市 模型 的 建设 是 基于 需求 分 析 得 到 的 结 末 ， 数 据 集 市 的 建 模 主要 针对 事实 表 
和 维 表 的 设计 。 例 如 ， 部 门 员 工 关 系 表 ， 如 来 事实 表 包 含 部 门 编码 ， 则 数据 可 以 分 析 a 到 部 门 ; 
如 果 事 实 表 叉 包含 员工 编码 ， 则 数据 既 可 以 分 析 到 部 门 ， 又 可 以 分 析 到 员工 。 一 张 事实 表 除 
了 包含 所 要 分 析 的 维度 编码 外 ， 还 包括 需要 分 析 的 度量 值 。 例 如 ， 用 户 用 电 分 析 事 实 表 见 
表 2-5$)， 它 的 主题 描述 就 是 按 地 区 、 时 间 、 电 压 等 级 统计 用 户 的 耗 电 量 、 应 收 电 这 ， 并 进行 
同期 对 比 ; 它 的 维度 残 是 地 区 、 时 间 、 电 压 等 级 ， 上 度量 值 包括 耗 电量 、 应 收 电 费 等 ， 指 标 来 
源 束 是 数据 仓库 中 的 计 费 结果 表 、 用 户 基 本 信息 表 。 维 表 一 般 采 用 增 量 的 方式 进行 抽取 。 





















































表 2-5 用 户 用 电 分 析 事 实 表 





分 析 的 主题 用 户 用 电 情 况 分 析 

需求 目标 按 地 区 、 时 间 、 电 压 等 级 统计 用 户 的 耗 电 量 、 应 收 电费 ， 并 进行 同期 对 比 
维度 组 成 地 区 、 时 间 、 电 压 等 级 

分 析 的 指标 耗 电量 、 应 收 电费 

分 析 方 法 同比 s -环比 

数据 来 源 电力 营销 系统 

指标 来 源 计 费 结果 表 、 用 户 基本 信息 表 


2.10.6 “数据 源 分 析 


数据 源 分 析 是 指 通 过 和 寅 求 调研 得 知 业务 数据 源 的 基本 和 情况， 并且 加 以 详细 说 明 ， 具 体内 
容 包 括 数据 源 中 存在 哪些 物理 表 ， 表 之 间 的 关系 和 表 中 每 个 子 段 的 数据 类 型 和 含义 等 。 一 上 般 
来 说 ， 业 务 数据 源 可 能 存在 数据 不 完整 、 不 一 致 的 现象 ， 或 者 各 个 数据 源 存 在 业务 规则 不 统 
一 的 情况 。 了 解 这 些 数据 源 的 特点 ， 有 利于 ETL 抽取 时 对 数据 的 整合 和 统一 ， 从 而 保证 数据 
的 质量 和 可 信 虔 。 


2.10.7 ”数据 的 获取 与 整合 

数据 的 获取 与 整合 存在 于 数据 仓库 项 目 中 的 各 个 阶段 。ETL 过 程 实际 上 束 是 数据 流动 的 
过 程 ， 即 从 不 同 的 数据 源流 问 统 一 的 目标 数据 库 。 数 据 的 获取 与 整合 是 完成 数据 仓库 建设 最 
复杂 的 过 程 ， 它 关系 到 数据 的 质量 ， 是 数据 仓库 项 目 建 设 的 根基 。 
2.10.8 ”应 用 分 析 

应 用 分 析 可 以 有 图 形 、 查 询 列 表 、 报 表 、 文 字 报 告 等 形式 。 应 用 分 析 是 数据 仓库 辅助 决 
策 系 统 架 构 的 最 高 层次 ， 一 般 都 是 采用 专业 的 商业 智能 工具 实现 的 。 丙 业 智 能 系统 架构 图 如 
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图 2-31 所 示 。 
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2.10.9 ”报表 展现 


在 商业 智能 中 ， 报 表 展 现 功 能 主要 利用 第 三 方 工具 或 者 专业 的 报表 工具 对 数据 进行 展示 
和 分 析 。 报 表 工 具 不 仅 需 要 文 持 多 维 分 析 ， 同 时 还 要 有 丰富 的 图 表 案 例 ， 使 展现 出 来 的 数据 
不 那么 空 润 ， 图 像 更 加 生动 ， 展 示 的 形式 更 加 多 样 化 ， 同 时 保证 数据 更 加 真实 。 报 表 定 义 了 
很 多 格式 ， 可 以 通过 柱 形 图 、 饼 形 图 等 方式 来 展现 报表 。 

例如 ， 可 以 使 用 饼 形 图 的 方式 展示 出 不 同 季 度 的 用 电容 量 情 况 ， 如 图 3-32 所 示 。 


数据 仓库 的 实施 步骤 如 图 2-33 所 示 。 
"V 数据 仓库 的 设计 ODS 
需求 分 析 逻辑 分 析 系统 


国 第 一 季度 "yv — 
- ^ ` JA 


L] 第 三 季度 


B] 第 四 季度 jw 应 用 分 析 报表 展现 


图 2-32 不同 季 度 的 用 电容 量 图 2-33 ”数据 仓库 的 实施 步 又 



























































2.11 在 大 数据 环境 下 的 数据 仓库 的 建设 


在 大 数据 环境 下 的 仓库 染 构 如 下 图 所 示 : 
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其 中 流 数据 强调 的 是 实时 处 理 与 分 析 ， 而 不 是 数据 存储 ， 所 以 一 般 上 只 在 内 存 中 进行 处 理 ， 
随 看 数据 的 流动 ， 只 针对 一 定时 间 内 的 流 数 据 进行 处 理 和 分 析 。 


结构 化 数据 ODS 数据 仓库 分 析 应 用 





y au | 分 析 应 用 


- TI! 


图 2-34 ”在 大 数据 环境 下 的 数据 仓库 的 建设 


对 于 数据 仓库 来 说 ， 存 储 的 都 是 金子 ， 全 部 都 是 有 用 的 信息 。 而 Hadoop 平台 存储 的 都 是 
金 矿 石 ，Hadoop 平台 的 目的 是 为 了 把 金 矿 石 里 的 金子 沛 选 出 来 。 

所 有 的 非 结 构 化 数据 都 通过 Hadoop 平台 进行 分 析 , 例如 通过 网 上 搜集 信息 , 分 析 人 们 对 
企业 的 情感 分 机， 还 有 预警 分 机， 包括 正面 、 负 面 的 信息 ， 最 后 产生 了 声誉 分 析 。 

非 结 构 化 的 数据 可 以 经 过 结构 化 处 理 再 与 数据 仓库 中 的 数据 结合 起 来 分 析 ， 或 者 单独 进 
行 分 析 。 


242 ”数据 仓库 建设 路 线 图 


agitis 般 来 说 分 成 三 个 阶段 进行 
一 阶段 : Wi 的 建设 ， 因 为 数据 仓库 是 面向 主题 的 、 集 成 的 、 历 史 的 、 
相对 稳定 的 数据 的 人 。 对 于 面向 主题 、 集 成 的 特点 ， 数 据 仓 库 的 数据 应 该 按 照 数 据 仓 库 的 
模型 进行 存储 和 摆 放 。 数据 仓库 模型 的 建设 在 吉 到 个 数据 仓库 建设 中 占 了 相当 大 的 比重 。 建 设 
的 内 容 包 括 完 成 数据 仓库 企业 级 的 概念 模型 和 应 用 级 的 逻辑 模型 的 建设 ， 最 后 完成 基于 仓库 
物理 模型 的 实现 。 

第 二 阶段 : 按照 数据 仓库 的 模型 ， 将 基础 数据 、 产 品 数 据 或 者 是 日 忘 数 据 在 数据 仓库 中 
进行 存放 ， 并 且 完 成 历史 数据 的 迁移 。 建 设 内 容 可 以 包括 设计 数据 仓库 的 基础 层 ， 开 发 校 验 
规则 ， 对 入 库 的 数据 进行 检查 ， 它 的 数据 流转 如 图 2-35 所 示 : 源 数据 通过 交换 层 将 数据 放 入 
数据 仓库 中 。 

第 三 阶段 : 完成 数据 仓库 汇总 层 和 数据 集 市 的 设计 ， 最 后 将 数据 仓库 数据 加 工 后 导入 
到 数据 集 市 中 。 它 的 数据 流转 如 图 2-36 所 示 : 汇总 层 数据 来 日 于 基础 数据 层 的 数据 ， 集 市 
数据 来 目 于 汇总 的 数据 或 者 基础 数据 层 的 数据 , 集 市 数据 加 工 完 成 后 同步 到 应 用 , 对 外 提供 
服务 。 
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图 2-35 通过 交换 层 将 数据 放 入 数据 仓库 中 
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图 2-36 ”数据 流转 图 


249 ”数据 仓库 的 作用 


数据 仓库 主要 有 3 个 方面 的 作用 ， 如 图 2-37 所 示 。 

1) 数据 仓库 系统 提供 了 标准 的 报表 和 图 表 展 示 功 能 ， 数 据 仓库 内 的 数据 来 源 于 不 同 的 业 
务 处 理 系统 ， 而 数据 仓库 系统 展示 的 数据 是 整个 企业 的 数据 集成 ， 数 据 仓库 的 作用 就 是 利用 
这 些 最 宝贵 的 业务 数据 做 出 最 明智 的 商业 决策 。 

2) 数据 仓库 文 持 多 维 分 机 。 多 维 分 析 通 过 把 一 个 实体 的 属性 定义 成 维度 ， 使 用 户 能 方便 
地 从 多 个 角度 汇总 、 计 算数 据 ， 增 强 了 数据 的 分 析 处 理 能 力 ， 通 过 对 不 同 维度 数据 的 比较 和 分 
析 ， 增 强 了 信息 处 理 能 力 。 多 维 分 析 是 数据 仓库 系统 在 决策 分 析 过 程 中 非常 有 用 的 一 个 功能 。 

3) 数据 仓库 是 数据 挖掘 技术 的 关键 和 基础 。 数 据 挖掘 技术 是 在 已 有 数据 的 基础 上 ， 帮 助 
用 户 理解 现 有 的 信息 ， 并 且 在 当前 信息 的 基础 上 ， 对 未 来 的 企业 状况 做 出 预测 ， 在 数据 仓库 
的 基础 上 进行 效 据 挖 据 ， 可 以 针对 整个 企业 的 发 展 状况 和 未 来 前 景 做 出 较为 完整 、 合 理 、 准 
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确 的 分 析 和 预测 。 
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图 2-37 数据 仓库 的 主要 作用 


244 数据 仓库 的 建设 意义 


数据 仓库 的 建设 意义 如 下 : 

1) 使 企业 高 层 领导 能 够 从 全 局 角度 出 发 ， 推 动 企 业 数 据 的 统一 规划 ， 便 于 业务 人 员 对 企 
业 数 据 的 分 析 与 理解 。 

2) 可 以 形成 企业 的 概念 模型 ， 帮 助 企 业 人 员 更 好 地 理解 业务 核心 概念 和 业务 之 间 的 
关系 。 

3) 帮助 设计 人 员 制 定 出 更 加 合理 的 数据 架构 和 统一 的 数据 分 布 图 。 

4) 可 以 明确 各 个 业务 部 门 乙 间 的 关系 和 在 分 析 应 用 工作 中 的 主要 职责 ， 有 利于 实现 统 
一 的 报表 体系 规范 ， 便 于 实现 企业 的 运营 指标 分 机 和 统一 的 口径 。 

5) 形成 有 效 的 数据 管理 体系 ， 保 证 企业 在 业务 部 门 众 多 ， 内 部 数据 和 外 部 数据 复杂 的 情 
况 下 ， 数 据 只 有 唯一 事实 的 特 反 。 

6) 为 业务 人 员 提 供 各 种 报表 便 询 功能 ， 为 应 用 系统 提供 强大 的 数据 分 析 功 能 。 














245 本章 小 结 


1) 数据 仓库 的 定义 : 数据 仓库 是 一 个 面 癌 主题 的 、 集 成 的 、 稳 定 的 、 反 映 历 史 变 化 的 数 
据 集 合 ， 用 于 支持 泄 理 决 倘 。 数 据 仓 库 是 计算 机 应 用 发 展 的 必然 产物 ， 它 搜集 了 企业 相关 内 
部 和 外 部 各 个 系统 的 数据 源 、 归 档 文件 等 一 系列 历史 数据 ， 包 括 大 量 原 始 数 据 、 业 务 数据 ， 
该 系统 用 于 构建 面向 企业 管理 者 的 决策 文 持 系统 。 

2) 数据 仓库 的 特点 : 面向 主题 的 、 集 成 的 、 稳 定 的 、 有 反映 历史 变化 的 数据 集合 。 

3) 数据 仓库 模型 设计 :数据 模型 分 为 概念 模型 、 远 辑 模型 、 物 理 模 型 。 概 念 模型 建 模 的 
iE NUR] EA CH PLA EAT: 通过 对 业务 系统 的 详细 说 明 ， 进 行 数据 的 梳理 ， 列 出 数据 
主题 详细 的 清单 ， 并 对 每 个 数据 主题 都 作出 详细 的 解释 ， 然 后 再 经 过 归纳 、 分 类 ， 整 理 成 数 
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据 主 题 域 ， 列 出 每 个 数据 主题 域 包含 哪些 部 分 ， 并 对 每 个 数据 主题 域 作 出 解释 ， 最 后 划分 成 
主题 域 概念 模型 。 风 辑 模 型 是 以 概念 模型 为 基础 ， 对 概念 模型 的 进一步 细 化 、 分 解 。 物 理 模 
型 最 终 确 定数 据 仓 库 的 表 名 、 列 名 及 相关 属性 ， 并 生成 定义 数据 库 的 SQL 命令 。 

4) 数据 模型 是 指 用 实体 、 属 性 、 实 体 之 间 的 关系 对 业务 概念 和 逻辑 规则 进行 统一 的 定义 ， 
命名 和 编码 ， 主 要 描述 企业 的 信息 需求 和 业务 规则 ， 是 业务 人 员 和 开发 人 员 沟通 的 语言 ， 是 
数据 仓库 架构 设计 工作 开始 的 第 一 步 。 正 确 的 数据 模型 是 用 户 需 求 的 集中 体现 ， 是 商业 智能 
项 目 成 功 与 否 最 重要 的 因素 之 一 。 

5) 数据 仓库 开发 过 程 包括 : 数据 仓库 规划 分 析 与 确定 需求 ， 概 念 模型 的 开发 ， 逻 辑 模型 
的 开发 ， 数 据 仓库 体系 结构 设计 ， 元 数据 的 设计 与 物理 表 的 实现 ， 数 据 抽取 、 转 换 、 加 载 ， 
数据 仓库 实施 应 用 ， 数 据 仓库 维护 等 过 程 。 

6) 数据 仓库 的 价值 不 在 于 存储 数据 量 的 多 少 ， 而 是 在 于 用 户 能 从 数据 仓库 中 得 到 的 信息 
和 知识 。 

7) 在 数据 仓库 的 概念 模型 中 ， 业 务 建 模 主 要 有 两 种 方式 : 

e 从 企业 的 战略 目标 出 发 ， 结 合 业务 需求 和 调研 的 内 容 ， 进 行 自 顶 向 下 开发 ， 保 证 模型 

不 偏离 商业 智能 项 目的 目标 。 
e 分 析 现 有 系统 的 数据 内 容 ， 通 过 归纳 和 总 结 ， 自 底 向 上 进行 概念 模型 建设 ， 即 从 数据 
的 角度 去 理解 业务 的 需求 和 规则 。 

8) 模型 设计 中 主要 的 设计 元 素 有 主题 、 实 体 、 属 性 、 关 系 。 主 题 是 指 与 业务 相关 的 数据 
的 主要 分 类 。 主 题 域 是 企业 数据 的 主题 的 集合 ， 反 映 了 企业 数据 的 子 集 ， 主 要 包含 主题 、 实 
体 、 属 性 以 及 它们 之 间 的 关系 ， 是 数据 模型 中 最 大 的 逻辑 单位 。 实 体 通 常 是 一 个 人 、 一 个 地 
点 或 者 是 一 个 事件 ， 在 实体 模型 中 是 唯一 的 、 不 可 再 分 的 最 小 逻辑 单位 。 实 体 一 般 分 成 主 实 
体 、 子 实体 、 属 性 实体 、 关 系 实 体 。 其 中 主 实 体 是 不 依赖 于 其 他 任何 实体 而 独立 存在 的 实体 ， 
如 用 户 实体 、 产 品 实体 等 ， 子 实体 是 对 父 实 体 的 逻辑 分 类 ， 一 般 继 承 父 实体 的 所 有 特征 、 属 
性 和 关系 。 

9) 数据 集 市 就 是 满足 特定 的 部 门 或 者 用 户 的 需求 ， 按 照 多 维 的 方式 进行 存储 ， 包 括 定 义 
维度 、 需 要 计算 的 指标 、 维 度 的 层次 等 ， 生 成 面 癌 决策 分 析 需 求 的 数据 立方 体 。 

10) 数据 仓库 和 数据 集 市 的 区 别 : 数据 仓库 是 面 癌 主题 的 、 集 成 的 数据 集合 。 而 数据 集 
市 被 定义 为 星 形 结构 或 者 雪人 花形 数据 结构 ， 通 常 由 一 张 事实 表 和 儿 张 维 表 组 成 。 

11) 数据 仓库 实施 详细 步骤 : 需求 分 机、 数据 仓库 的 逻辑 分 析 、ODS 设计 、 数 据 仓库 建 
模 、 数 据 集 市 建 模 、 数 据 源 分 析 、 数 据 的 获取 与 整合 、 应 用 分 析 、 报 表 展 示 。 

12) 数据 仓库 在 多 辑 上 可 以 分 成 操作 型 数据 库 、 数 据 仓库 层 、 数 据 集 市 层 、 数 据 分 析 应 
用 层 、 报 表 展 示 层 。 

13) ODS 数据 缓冲 区 主要 为 业务 源 数据 抽取 到 数据 仓库 中 提供 中 间 数 据 缓冲 的 功能 ， 与 
ODS 统一 信息 视图 区 最 大 的 区 别 就 是 数据 抽取 、 清 洗 、 转 换 、 加 载 的 转换 规则 和 数据 存储 的 
方式 不 同 。ODS 统一 信息 视图 区 是 完全 按照 主题 的 方式 进行 数据 存储 ， 向 用 户 提 供 快 速 的 报 
表 展 示 和 数据 实时 查询 的 功能 。 而 ODS 数据 绥 冲 区 的 ETL 规则 一 般 只 进行 简单 的 汇总 、 计 
AX, 或 者 从 操作 型 数据 库 中 直接 抽取 而 中 间 不 进行 任何 转化 。 

140 数据 仓库 的 主要 作用 。 数 据 仓库 主要 有 3 个 方面 的 作用 : 利用 最 宝贵 的 业务 数据 作 
出 最 明智 的 商业 决策 、 文 持 多 维 分 析 、 分 析 和 预测 功能 。 
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第 3 革 unter OTE AA 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e (| STA. 

e 数据 挖掘 方 法 的 几 个 步骤 。 

e Zi. 

e 数据 仓库 和 数据 控 据 之 间 的 关系 。 
e 数据 挖掘 的 主要 过 程 。 

e 数据 挖掘 的 主要 应 用 。 


3.1 什么 是 数据 挖掘 


数据 挖掘 (DataMining) 起 源 于 1989 年 8 月 ， 美 国 底特律 举办 的 第 11 届 国 际 联合 人 工 
智能 学 术 会 议 中 Piatetsky * Sharpiro 提出 的 KDD (Knowledge Discovery and DataMining )。 

它 的 含义 就 是 从 海量 的 数据 中 抽取 出 有 意义 的 、 重 要 的 、 潜 在 有 用 的 信息 和 知识 的 过 程 。 
从 技术 上 来 说 ， 数 据 挖掘 是 一 门 交 义学 科 ， 融 合 了 统计 学 、 人 工 智能 、 模 式 识别 、 机 器 学 习 
等 内 容 。 

数据 挖掘 的 工作 过 程 可 以 包括 数据 的 抽取 、 存 储 管理 、 控 据 和 展现 等 几 个 部 分 。 所 谓 抽 
取 束 是 将 数据 从 外 部 数据 源 或 者 其 他 联机 事务 处 理 系 统 中 导入 到 数据 仓库 或 者 其 他 数据 库 
中 。 存 储 管理 主要 针对 如 何 管理 海量 的 数据 、 优 化 查询 效 率 和 处 理 各 种 并 友 数 据 等 。 挖 掘 束 
是 利用 各 种 的 挖掘 算法 得 到 相应 知识 的 过 程 。 最 后 数据 展现 承 是 实现 各 种 预定 义 租 询 、 动 态 
报表 三 询 等 内 容 ， 展 示 的 方式 包括 直方 向、 动态 模拟 和 人 饼 岁 等 形式 。 更 简单 地 说 ， 数 据 控 所 
残 是 将 对 数据 的 简单 得 询 提 升 到 欣 据 信息 和 知识 的 过 程 。 


3.2 ”数据 挖掘 方法 的 几 个 步 又 


数据 挖 据 是 一 个 闭环 的 、 反 复 循 环 的 过 程 。 需 要 业务 分 析 人 员 和 IT 工程师 共同 完成 。 一 
RREA A FILAR: 

(1) 定义 业务 范围 。 在 这 个 阶段 需要 明确 对 数据 挖 据 的 目标 和 定位 ， 制 定数 据 挖 抉 的 
计划 。 

(2) 选择 合适 的 数据 ， 定 义 相关 的 训练 数据 集 和 验证 数据 集 等 内 容 。 

(3) 对 数据 进行 探索 分 析 ， 使 效 据 集 尽 可 能 满足 建 模 算法 的 要 求 。 

(40 分 析 并 且 确 定数 据 挖 抉 模型。 建 模 人 员 需 要 不 断 地 测试 模型 性 能 ， 从 而 选择 出 最 佳 
的 数据 模型 。 

(5) 模型 实施 和 评价 。 通 过 模型 的 结果 帮助 相关 人 员 做 出 战略 决策 。 同 时 搜集 结 来 反馈 ， 
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判断 是 否 需 要 改进 模型 。 
3.3 ”数据 挖掘 党 用 算法 


常用 的 数据 挖 所 算法 主要 包括 分 类 、 到 类 和 关联 规则 三 种 

分 类 主要 是 对 目标 数据 进行 分 类 。 可 以 通过 训练 集 建立 模型 ， 通 过 测试 集 去 验证 模型 的 
效果 ， 最 后 再 通过 该 模型 对 目标 数据 进行 分 类 。 其 中 常用 的 分 类 算法 是 决策 树 。 

聚 类 主要 是 将 相似 的 事物 分 成 一 类 ， 将 差异 较 大 的 事物 分 布 在 不 同 的 类 中 ， 即 “ 物 以 类 
聚 ”保证 各 个 组 间 的 特征 差异 性 最 大 。 例 如 聚 类 分 析 可 以 发 现 特征 差异 很 大 的 客户 群 

聚 类 和 分 类 的 区 别 是 ， 聚 类 不 依赖 确定 好 的 组 别 ， 也 没有 样本 数据 ， 数 据 是 按照 自身 特 
征 的 相似 性 聚集 在 不 同 的 类 别 中 ， 在 数据 控 气 中， 常用 的 聚 类 算法 是 K 均值 算法 ， 关 联 规则 
主要 是 确定 哪些 事物 可 以 在 一 起 出 现 ， 例 如 设计 各 种 商品 和 服务 的 组 合 。 


3.4 ”数据 仓库 和 数据 挖掘 之 间 的 天 系 


我 们 可 以 引用 商业 智能 的 概念 ， 决 策 人 员 以 企业 级 数据 仓库 为 基础 ， 由 联机 分 析 处 理工 
上 其、 数据 挖 抉 工具 加 上 决 朱 人 员 的 专业 知识 ， 从 数据 中 获得 有 用 的 信息 和 知识 ， 帮 助 企业 获 
取 利 润 ， 而 数据 挖 气 束 是 建立 在 数据 仓库 基础 上 的 增值 技术 。 

数据 仓库 是 为 了 文 持 企业 决策 分 析 的 数据 集合 。 它 是 面向 主题 的 、 集 成 的 、 稳 定 的 ， 并 
昌 随 看 时 间 发 生变 化 。 它 的 关键 拉 术 包括 数据 的 抽取 、 
清洗 、 转 换 、 加 载 和 维护 技术 。 

数据 挖 抉 是 从 海量 的 数据 中 ， 抽 取出 有 意义 的 、 潜 
在 有 用 的 信息 和 知识 的 过 程 。 数 据 挖 掘 的 数据 来 源 可 以 
征 数 据 仓 库 或 者 是 其 他 数据 库 。 对 于 挖掘 的 数据 需要 进 
行 选择 ， 挫 掘 的 结 末 也 需要 进行 评 佑 ， 投 照 评 售 结 此 的 
不 同 ， 一 般 需 要 重 狐 分 机 和 计算 。 

数据 挖 据 可 以 对 数据 仓库 中 的 历史 数据 进行 所 炬 和 
挖 据 ， 使 得 这 些 数 据 成 为 信息 和 知识 。 可 以 信 助 对 历史 
数据 的 分 析 ， 发 现 数据 内 部 有 价值 的 规律 。 

数据 仓库 是 数据 挖 据 的 基础 。 因 为 数据 仓库 的 数据 
是 完整 的 、 集 成 的 ， 它 为 数据 挖 抉 提供 了 扎实 的 数据 基础 。 数 据 仓库 可 以 为 数据 挖 扬 提供 十 
要 的 历史 数据 和 全 面 的 数据 处 理 、 分 析 等 基础 设施 。 


3.9 ”数据 挖掘 的 主要 过 程 


数据 挖掘 的 过 程 主要 包括 : 定义 商业 问题 、 建 立 数据 挖 据 库 、 确 定 分 析 的 内 容 、 准 备 数 
据 、 建 立 模 型 、 评 价 模型 和 实施 。 如 图 3-2 所 示 : 

定义 各 种 商业 问题 

对 业务 问题 和 数据 挖掘 的 目标 进行 明确 的 定义 ， 例 如 从 整体 上 分 析 市 场 的 结构 和 发 展 的 
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数据 挖掘 技术 




















数据 库 其 他 数据 源 
图 3-1 数据 仓库 和 数据 挖 据 之 间 的 关系 
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建立 数据 挖掘 库 

主要 过 程 包括 : 对 数据 的 搜索， 确定 需要 欣 掘 的 
数据 源 。 选 择 用 于 挖掘 的 数据 ， 对 数据 的 质量 进行 评 
佑 ， 确 定数 据 的 哪些 属性 会 影响 模型 的 质量 ， 判 断 是 
售 建 立 数据 仓库 。 

确定 分 析 的 内 容 

以 旅游 行业 为 例 ， 分 析 的 内 容 可 以 包括 : 线路 分 
析 、 出 行 时 间 、 人 数 分 析 、 旅 游 目的 分 析 和 客户 关联 
分 析 等 。 举 例 来 说 ， 根 据 分 析 可 以 确定 旅游 业 的 旺季 
集中 在 哪 几 个 月 份 ， 哪 坚 群 体 更 喜欢 外 出 旅游 等 。 图 3-2 数 损 控 据 的 主要 过 在 

准备 数据 

准备 数据 的 主要 过 程 包括 : 选择 最 优 的 预测 变量 ， 如 末 数 据 量 较 大 ， 可 以 进行 数据 抽样 ， 
也 可 以 在 原始 数据 中 衍生 新 的 变量 作为 预测 变量 。 

建立 模型 

建立 对 商业 问题 最 有 用 的 模型 ， 然 后 不 断 地 优化 ， 它 是 一 个 反复 的 财 环 过 程 。 同 时 还 要 
决定 预测 的 类 型 ， 例 如 是 分 类 还 是 回归 。 

评估 模型 

当 模 型 建 并 之后， 应 该 评估 结 末 和 价值 。 随 看 应 用 数据 的 变化 ， 模 型 的 准确 率 也 会 随 之 
发 生变 化 。 因 为 各 种 隐 含 的 因素 ， 可 能 会 导致 经 过 模拟 计算 出 来 的 高 准确 率 模 型 ， 不 一 定 是 
正确 的 模型 。 

实施 

当 模 型 建立 并 且 经 过 验证 之 后 ， 提 供给 分 机 人 员 作 为 参考 。 


3.6 ”数据 挖掘 的 主要 应 用 一 一 客户 精准 营销 
































3.6.1 客户 精准 营 硝 背景 

随 寿 技术 的 发 展 和 市 场 竞 争 的 激烈 ， 传 统 的 营销 系统 很 难 应 对 复杂 的 市 场 环境 ， 大 众 化 
的 营销 方式 已 经 逐渐 失去 了 优势 ， 只 有 基于 客户 基本 信息 和 行为 ， 采 用 客户 精准 营销 的 方式 
才能 提高 营销 的 效益 ， 同 时 大 大 降低 营销 的 成 本 。 那 么 什么 是 客户 精准 营销 呢 ? 

客户 精准 营销 就 是 通过 控 据 技术 手段 ， 实 现 企业 和 客户 之 加 的 个 性 化 沟通 服务 体系 。 精 
准 营 销 包括 客户 的 需求 分 析 、 市 场 细 分 等 内 容 。 因 为 市 场 需求 的 多 样 化 ， 要 求 企 业 能 够 为 客 
户 提 供 多 样 化 的 产品 和 服务 ， 可 以 快速 捕捉 到 市 场 的 再 求 和 未 来 发 展 预 测 的 能 

下 面 分 别 以 旅游 行业 和 银行 为 例 ， 介 绍 客户 精准 营销 的 应 用 方式 。 
3.6.2 ”关于 旅游 行业 的 客户 精准 营销 

旅游 行业 的 客户 精准 营销 ， 可 以 通过 客户 细 分 、 客 户 流 
估 等 模型 来 实现 。 
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分 析 、 交 文 销售 和 客户 价值 评 





客户 细 分 的 目的 是 为 了 实现 客户 的 差异 化 服务 。 客 户 流失 分 析 是 为 了 挽留 客户 ， 并 提高 
客户 的 忠诚 度 。 交 又 销售 是 为 了 提升 交叉 销售 率 。 客 户 价 值 评估 是 综合 衡量 客户 在 当前 页 献 
度 、 未 来 页 献 度 、 信 用 度 、 上 忠诚 度 和 未 来 成 长 潜力 等 几 个 方面 的 表现 。 

(1) 客户 细 分 

客户 细 分 可 以 实现 客户 的 差异 化 服务 ， 使 产品 和 服务 更 直接 地 针对 合适 的 客户 和 群 。 客 户 
细 分 可 以 使 用 挖掘 的 分 类 和 聚 类 算法 实现 。 

客户 细 分 的 流程 ， 如 图 3-3 所 示 : 

海量 客户 的 行为 数据 和 特征 数据 
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客户 行为 -价值 细 分 模型 


为 组 内 行为 特点 相似 ， 组 间 
行为 差异 较 大 的 客户 分 组 


图 3-3 客户 细 分 的 流程 


客 己 行为 细 分 模型 可 以 通过 选择 变量 ， 分 析 影 响 客 户 分 组 的 主要 因子 ， 根 据 聚 类 形成 相 
似 的 群体 ， 保 证 组 中 特征 莽 别 明显 ， 最 后 提出 针对 性 的 业务 推广 与 建议 。 如 图 3-4 所 示 : 
1) 选择 变量 ， 分 析 影 啊 客 户 分 组 的 主要 因子 。 


游客 性 别 证 件 号 码 
游客 年 具 缴 款 方式 


出 游 的 目的 学 历 游客 的 消费 金额 游客 出 游 的 天 数 








游客 收入 信息 应 收 金 额 游客 收入 信息 一 年 内 ， 游 客 出 游 的 次 数 
游客 的 消费 金额 游客 出 游 的 天 数 





是 否 在 外 过 夜 一 年 内 ， 游 客 出 游 的 次 数 


图 3-4 影响 客户 分 组 的 主要 因子 


2) 保证 组 中 特征 差别 明显 。 

3) 提出 针对 性 的 业务 推广 与 建议 。 
组 中 特征 如 图 3-5 所 示 。 

业务 推广 建议 : 
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描述 性 名 称 
游客 收入 较 高 ， 消 费 金额 中 等 水 平 ， 旅 游 天 数 较 短 ， 次 数 较 少 特征 组 1: 旅游 贵 中 求 惠 组 


游客 收入 中 等 ， 旅 游 天 数 较 得、 次 数 较 少 ， 消 费 金 额 较 高 特征 组 2: 旅游 新 生 潜力 组 
出 洲 的 时 间 较 长 ， 次 数 频 壹 特征 组 3: 热衷 旅游 组 





图 3-$ 组 中 特征 


a) 特征 组 2: 统计 分 析 发 现 该 比例 人 数 较 多 ， 且 大 部 分 都 是 25 c —35 zm], AGE 
多 是 商务 人 士 ， 喜 欢 购 物 。 

b) 特征 组 1: 统计 分 析 发 现 该 比例 人 群 大 多 都 是 中 年 人 士 ， 以 家 大 为 单位 的 旅 洲 居多 ， 
大 多 喜欢 景点 游 ， 较 少 喜 欢 购物 游 ， 消 费 趋 于 理性 。 

c) 特征 组 3: 统计 分 析 发 现 该 比例 人 群 多 数 都 是 20—24 岁 之 间 的 学 生 群 体 ， 购 物欲 户 较 
小 ， 喜 欢 景 点 游 和 过 夜 。 

客户 服务 建议 : 

a) 对 于 特征 组 2， 应 该 增加 购物 游 的 宣传 ， 例 如 香港 购物 三 日 游 。 时 间 宜 选择 在 假期 。 

b) 对 于 特征 组 1， 可 以 增加 适合 家 庭 游 的 景点 、 游 乐园 的 宣传 ， 例 如 香港 迪斯尼 三 日 游 ， 
时 间 宜 选择 公共 假期 。 

c) 对 于 特征 组 3， 可 以 增加 类 似 于 运动 、 长 途 类 型 的 旅游 ， 例 如 西藏 七 日 游 。 

客户 细 分 的 优势 : 

a) 确定 每 个 客户 群 的 特征 ， 指 导 差 异化 的 客户 服务 。 

b) 可 以 协助 企业 推出 新 产品 。 

c) 为 狐 产 品 寻找 目标 群体 。 

d) 理解 客户 对 产品 的 喜好 ， 按 需求 提供 产品 。 

e) 针对 客户 群 制定 推广 策略 。 

(2) 客户 流失 分 析 

工作 流程 如 图 3-6 所 示 : 



































客户 流失 倾向 预警 模型 


未 来 1 一 2 个 月 内 具有 高 
概率 的 用 户 流 失 的 名 单 


" 
j 





图 3-6 客户 流失 分 析 工 作 流 程 
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举例 来 说 ,满足 该 规划， 如果 旅 游 者 的 年 出 游 次 数 突然 减少 ， 并 且 对 购物 、 住 答 等 评价 
很 低 ， 可 能 是 高 危 用 户 。 如 果 旅 游 者 的 出 游 次 数 没有 减少 ,但 是 对 购物 、 住 窒 评 价 变 低 ， 客 
户 可 能 会 流失 。 

(3) 交叉 销售 

交叉 销售 是 促使 客户 购买 尚未 使 用 的 产品 和 服务 的 营销 手段 ， 通 过 研究 客户 对 产品 的 使 
用 习惯 和 消费 行为 特点 去 发 现 老 客户 的 潜在 需求 。 同 时 交叉 销售 可 以 通过 产品 之 则 的 关联 ， 
寻找 捆绑 销售 的 机 会 ， 为 狐 产 品 寻找 已 有 用 户 中 的 目标 群体 。 交 叉 销 售 的 目的 是 问 狐 老 客户 
推销 尚未 使 用 的 产品 ， 同 时 将 老 产品 销售 给 新 客户 。 

(4) 客户 价值 评估 

客户 价值 评估 模型 的 搭建 ， 主 要 衡量 客户 五 个 方面 的 表现 ， 包 括 : 客户 的 当前 贡献 度 、 
未 来 贡献 度 、 信 用 度 、 忠 诚 度 和 成 长 潜力 等 。 如 图 3-7 Bran: 
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图 3-7 客户 价值 评估 模型 的 搭建 


3.6.3 ”关于 银行 业 的 客户 精准 营销 

举例 来 说 ， 当 一 名 客户 在 银行 中 存 入 一 笔 存 于 后 ， 他 可 能 会 考虑 如 何 使 这 些 资 金 获 得 
更 大 的 收益 ， 如 果 这 时 银行 销售 人 员 与 客户 主动 联系 ， 并 日 给 予 恰当 的 建议 ， 完 成 营销 任 
务 的 概率 束 会 大 大 增加 。 也 就 是 通过 评估 分 析 、 发 现 和 识别 客户 的 需求 ， 制 定 相 应 的 营销 
策略 。 

对 于 商业 银行 来 说 ， 通 过 CRM 系统 中 的 客户 行为 信息 ， 识 别 出 客 户 的 交易 信息 ， 并 发 
现 背 后 隐藏 的 客户 需求 ， 这 种 方式 不 仅 可 以 挽留 客户 ， 而 且 还 能 提升 客户 的 忠诚 度 ， 创 造 更 
大 的 利润 。 

精准 营销 方案 的 设计 : 

(1) 现状 调研 与 分 析 

主要 包括 对 业务 和 数据 的 现状 调研 ， 理 解 营销 的 活动 方式 和 过 程 。 

(2) 对 客户 交易 行为 的 定义 与 分 析 

主要 包括 数据 的 准备 和 模型 的 建立 。 

(3) 胎 销 活动 的 设计 和 评估 改进 

可 以 先 对 部 分 客户 进行 尝试 性 的 营销 ， 然 后 与 传统 营销 方式 的 结果 进行 对 比 ， 验 证 推广 
的 可 实施 性 ， 最 后 对 验证 结果 进行 评估 和 修正 ， 直 至 满足 目标 。 
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3.7 xm 





1) 数据 挖 据 (DataMining〉 起 源 于 1989 年 8 H, SEBESUEREERZISZMTISS 11 界 国际 联合 
人 工 智能 学 术 会 议 中 Piatetsky Sharpiro 提出 的 KDD(Knowledge Discovery and DataMining). 
它 的 含义 束 是 从 海量 的 数据 中 抽取 出 有 意义 的 、 重 要 的 和 湾 在 有 用 的 信息 和 知识 的 过 程 。 从 
技术 上 来 说 ， 数 据 控 据 是 一 门 交 又 学 科 ， 融 合 了 统计 学 、 人 工人 智能 、 模 式 识 别 、 机 器 学 习 等 
内 容 。 

2) 第 用 的 数据 挖掘 算 法 主要 包括 分 类 、 聚 关 和 关联 规则 三 种 。 

3) 数据 挖 抉 的 过 程 主要 包括 : 定义 商业 问题 、 建 立 数据 挖掘 库 、 确 定 分 析 的 内 容 、 准 备 
数据 、 建 立 模型 、 评 价 模型 和 实施 。 
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第 4 革 商业 智能 ETL 理论 知识 


本 章 目标 
通过 前 3 章 的 和 学习， 我 们 已 经 理解 了 商业 智能 的 系统 架构 ， 对 数据 仓库 的 设计 方法 和 实 
施 的 步骤 有 了 清楚 的 认识 。 本 章 将 重点 介绍 商业 智能 ETL 理论 知识 ， 包 括 ETL 的 核心 概念 、 
本 质 思 想 和 一 般 设 计 开 发 方法 等 内 容 。 本 和 曹 提出 了 实施 数据 仓库 项 目的 ETL 方法， 以 及 ETL 
的 框架 体系 结构 ， 重 点 讲解 了 ETL 的 数据 抽取 、 转 换 、 加 载 过 程 。 
学 习 本 革 后 ， 您 将 掌握 : 
@ ETL 的 地 位 。 
ETL HJ —XE RE. 
ETL 的 本 质 。 
ETL 的 体系 结构 。 
ETL 的 主流 工具 。 
ETL 的 详细 过 程 。 
ETL 的 优化 要 点。 
ETL Ii vA TG. 
ETL 的 框架 结构 。 











41 ElL 在 数据 仓库 中 的 重要 地 位 





在 数据 仓库 系统 中 ，ETL 占有 重要 的 地 位 ，ETL 作为 一 种 数据 整合 解决 方案 ， 己 经 上 升 
到 了 一 种 理论 的 蜗 度 。ETL 在 数据 仓库 中 具有 以 下 儿 个 特 后 。 

1) 数据 流动 具有 周期 性 。 一 般 来 说 ， 丙 业 智 能 ETL 按照 条 种 业务 抽取 规则 周期 性 运行 ， 
每 次 运行 都 会 加 载 新 的 数据 到 目标 库 中 。 

2) 因为 数据 仓库 中 的 数据 量 巨大 ， 一 般 采 用 成 玖 的 ETIL 工具 去 完成 抽取 、 转 换 、 加 载 ， 
以 降低 设计 开发 和 维护 的 复杂 上 度 , 使 设计 开发 人 员 有 更 多 的 时 间 去 专注 于 业务 转化 规则 。ETL 
是 数据 仓库 项 目 中 最 艰难 且 耗 时 最 长 的 工作 ，ETL 系统 的 设计 和 开发 工作 对 商业 智能 项 目的 
成 败 具 有 全 关 重 要 的 影响 ， 如 宋 把 数据 仓库 项 目 看 成 一 座 大 厦 的 话 ， 那 么 数据 模型 好 像 独 样 ， 
而 ETL 束 是 建造 这 座 大 厦 的 过 程 。 而 我 们 作为 从 事 商业 智能 的 专业 人 士 ， 需 要 真正 理解 ETL 
理论 方面 的 知识 ， 而 不 仅仅 停留 在 ETL 工具 的 使 用 上 ， 因 为 只 有 这 样 ， 才 能 更 好 地 肥 挥 它 的 
作用 。 

如 图 4-1 所 示 ， 建 筑 图 样 的 规划 丈 古 数据 仓库 模型 的 设计 过 程 ， 根 据 图 样 建造 房屋 的 过 
程 就 是 ETL 设计 开发 的 过 程 ， 而 那 座 类 丽 的 房屋 束 是 数据 仓库 的 成 末 。 可 以 看 出 建造 房屋 的 
过 程 就 是 耗 时 最 长 、 最 困难 的 工作 ， 而 ETL 也 是 整个 数据 仓库 项 目 中 难度 最 大 、 耗 纲 时 间 最 
TR ETE. 
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按照 图 样 进行 房屋 的 建设 建筑 图 样 的 规划 





4-1 数据 仓库 模型 的 设计 过 程 


42 ETL 的 一 般 过 程 


ETL 是 数据 抽取 (Extract)、 转 换 (Transform)、 加 载 (Load ) 的 简写 。 它 的 一 般 过 程 是 
指 : 将 源 数据 抽取 出 来 ， 经 过 数据 的 清洗 、 转 换 之 后 ， 加 载 到 目标 表 中 。ETL 过 程 一 般 都 是 
批量 操作 的 ， 如 图 4-2 所 示 。 










出 错 处 理 
转换 、 传 输 和 加 载 






连接 数据 源 和 目标 
数据 仓库 之 间 的 数 


访问 数据 源 据 源 


图 4-2 ETL 的 一 般 过程 


4.9 ”研究 ETE 的 本 质 


D 用户 应 该 理解 ETL 本 质 上 就 是 数据 从 源 到 目标 的 过 程 〈《 即 数据 流动 的 过 程 )。 在 数据 
仓库 中 历史 数据 是 海量 的 ，ETL 过 程 需要 经 历 以 下 几 个 步骤 : 抽取 、 请 洗 、 转 换 、 加 载 。 抽 
取 和 加 载 是 转换 过 程 的 输入 和 和 输出 部 分 ， 而 数据 转换 是 ETL 过 程 的 核心 部 分 ， 也 是 难度 最 大 
的 部 分 。 可 以 把 ETL 分 成 静态 单元 和 动态 单元 次 个 部 分 。 所 谓语 态 单元 ， 了 就 是 业务 数据 转换 
的 规则 ;， 而 动态 单元 是 ETL 时 间 调 度 的 最 小 单位 。 目 前 有 很 多 成 熟 的 工具 都 提供 ETL 功能 ， 
包括 Informatica, Datastage, Kettle 等 。 这 些 工 具 不 但 上 只有 可 视 化 的 数据 流动 、 转 换 编 辑 界 面 ， 
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还 提供 各 种 转换 规则 定义 和 数据 转化 的 函数 集 。 

2) £X ETL 工具 价格 郧 员 ， 宏 观 上 一 般 都 适合 处 理 海量 的 数据 ， 但 是 在 微观 上 需要 考 
虚 ETL 处 理 的 不 同情 况 。 在 数据 量 和 复 琳 度 都 不 蝇 的 情况 下 ,可 以 利用 ETL 工具 提供 的 组 件 
指定 数据 源 和 目标 库 ， 通 过 对 图 形 的 拖 忠 就 可 以 设 定 需要 转换 的 规则 ， 操 作 非 党 方便。 在 处 
理 大 数据 量 和 复杂 数据 转换 时 ， 一 般 采 用 编码 的 方式 进行 设计 和 开发 ， 更 直观 地 实现 业务 转 
换 的 规则 。ETL 工具 如 (Informatica, Datastage, Kettle) 都 是 用 图 形 界 面 去 设置 转换 规则 和 
编写 代码 程序 ， 这 需要 ETL 设计 开发 人 员 鸭 悉 工 具 中 的 各 种 组 件 和 规则 转换 函数 ， 当 然 这 些 
ETL 工具 不 可 能 提供 所 有 的 转换 规则 ， 所 以 一 般 ETL 工具 都 提供 特定 语言 环境 (JavaScript 
语言 脚本 和 存储 过 程 的 调用 功能 ) 来 实现 高 级 转换 功能 。 

3) 元 数据 是 ETL 过 程 的 重要 体现 ， 描 述 了 数据 源 的 属性 、 数 据 源 到 目标 库 的 转换 规则 ， 
数据 抽取 的 历史 记录 等 内 容 。ETL 的 所 有 过 程 一 般 都 是 依赖 元 数据 去 实现 数据 的 请 洗 、 转 换 ， 
最 后 加 载 到 目标 数据 仓库 中 ， 同 时 元 数据 也 是 数据 仓库 项 目 中 不 可 或 缺 的 部 分 。 采 用 元 数据 
方法 ， 可 以 实现 数据 抽取 流程 的 目 动 化 ， 并 且 保证 了 数据 抽取 的 及 时 、 准 确 和 完整 。 元 数据 
的 概念 在 数据 仓库 中 非常 重要 ， ETL 中 存在 大 量 的 数据 源 定 义 和 映 射 规则 、 转 换 规 则 ， 这 些 
都 是 元 数据 需要 管理 和 存储 的 。 

4) 如 条 构建 一 个 丙 业 智能 系统 ， 设 计 开 发 人 员 要 完全 理解 业务 数据 源 系 统 是 非常 困难 
的 ， 需 要 花费 大 量 的 时 间 去 整理 数据 源 的 属性 ， 更 多 的 人 喜欢 在 ETL 开始 之 前 束 将 所 有 的 业 
务 转换 规则 弄 清楚 。 

在 ETL 过 程 中 ， 如 采 遇 到 质量 有 问题 的 源 数据 ， 一 定 要 正面 对 符 这 些 垃圾 数据 或 者 错误 
数据 ， 是 丢弃 还 是 处 理 ， 这 些 问 题 都 是 无 法 逃避 的 。 假 设 这 些 数据 不 经 过 处 理 ， 那 么 在 ETL 
过 程 中 错误 会 逐渐 放大 ， 抛 开 数 据 源 质 量 问题 ， 我 们 再 来 看 看 ETL 过 程 中 哪些 因素 会 对 数据 
的 准确 性 产生 重大 影响 。 

影响 ETL 数据 质量 的 关键 因 系 包括 以 下 几 种 情况 : 

e 可 能 会 有 一 部 分 数据 因为 客观 或 者 人 为 的 原因 导致 数据 格式 混乱 。 

e 着 系统 设计 存在 不 合理 性 。 

e 在 开 友 过 程 中 ， 因 为 开发 人 员 的 错误 或 者 设计 人 员 对 业务 规则 描述 的 问题 ， 同 样 会 叶 

致 数据 质量 出 现 问题 。 

因为 各 种 因素 都 会 影响 ETL 数据 的 质量 。 保 证 数据 质量 的 方法 有 如 下 几 种 : 

首先 ， 用 户 必 须 壮 守 在 数据 仓库 项 目 中 数据 源 的 质量 要 求 ， 对 业务 源 数据 进行 仔细 分 析 ， 
以 便 对 数据 源 的 任何 错误 或 不 规范 的 地 方 有 相应 的 处 理 方法 ， 如 对 错误 数据 舍弃 或 者 修改 。 

其 次 ， 在 保证 数据 源 的 质量 之 后 ， 在 设计 ETL 的 过 程 中 ， 对 每 一 个 步骤 都 应 该 有 一 个 衡 
量 数据 质量 的 方法 ， 需 要 重视 ETL 的 每 一 个 过 程 。 对 于 有 误差 的 数据 ， 需 要 退 漳 到 根本 原因 ， 
并 且 将 数据 仓库 的 模型 与 数据 质量 的 验证 方法 统一 起 来 ， 实 现 每 一 步 的 ETL 过 程 都 有 验证 数 
据 质 量 的 脚本 。 

最 后 ， 歼 是 规范 业务 流程 ， 保 证 ETL 的 正确 性 ， 避 免 误 删 数 据 或 者 重复 加 载 业 务 数 据 。 

其 中 对 质量 的 衡量 有 下 面 儿 种 方式 ， 如 图 4-3 Bron. 

D 定义 的 数据 是 否 和 实际 数值 相同 。 例 如 ， 一 个 数据 项 “客户 来 电 等 候 率 ”是 描述 在 客 
户 服务 中 ， 客 人 来 电 等 候 的 时 间 超 过 lmin 的 次 数 /客人 来 电 的 总 次 数 。 随 看 客户 服务 质量 的 
提高 ， 客 人 来 电 等 候 率 会 发 生变 化 ， 当 客人 来 电 等 候 的 时 间 超 过 1min 的 次 数 减 少时 ， 客 户 来 
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电 等 候 率 也 会 相应 降低 ， 但 是 如 果 这 个 值 没有 被 更 新 ， 那 么 该 数值 可 能 是 不 正确 的 。 

2) 指标 数据 是 否 符合 业务 的 规则 。 例 如 ,“ 社 会 保险 类 别 ” 是 描述 社会 保险 分 类 的 信息 ， 
不 包括 劳动 保障 类 别 里 的 内 容 ， 这 个 指标 如 果 出 现 劳动 保障 类 别 里 的 信息 ， 就 表明 该 指标 韦 
背 了 业务 规则 。 

3) 数据 是 否 和 业务 源 系 统 中 的 信息 保持 一 致 。 该 数据 和 源 系统 中 公认 的 、 权 威 件 的 信息 
必须 保持 一 致 ， 否 则 该 数值 可 能 是 不 正确 的 。 例 如 ， 发 票 中 的 公司 名 称 必须 和 公司 注册 的 名 
称 保持 一 致 ， 公 司 涉及 的 所 有 票据 名 称 必须 和 公司 合同 里 的 名 称 保持 一 致 ， 和 否则 该 数值 可 能 
TERR. 

4) 数据 是 否 违 背 自然 规律 或 者 不 符合 常理 。 
如 果 数 据 与 业务 源 系统 中 公认 的 、 权 威 性 的 信息 pn 
保持 一 致 ， 但 是 却 违 背 了 自然 规律 或 者 不 符合 常 一 一 一 一 一 | 


理 ， 同 样 应 该 分 析 访 数据 是 否 正 人 确 。 数据 是 否 和 业务 源 系统 中 的 信息 保持 一 至 





























定义 的 数据 是 否 和 实际 数值 相同 





























44 FI1L 的 体系 结构 数据 是 否 违背 自然 规律 或 者 不 符合 常理 


ETL 的 体系 结构 如 图 4-4 Wn. 图 4-3 ”对 质量 的 衡量 方式 


操作 型 源 数据 库 Mapping 设计 


ZUR 


数据 抽取 


d 


数据 转换 


d 


数据 加 载 


d 


目标 数据 库 





图 4-4 ETL 的 体系 结构 


4.59 EIL 的 难点 


数据 仓库 项 目 中 必须 要 解决 的 问题 ， 束 是 多 个 源 数 据 中 可 能 存在 数据 不 一 致 的 问题 ， 这 
束 需 要 有 统一 的 编码 ， 将 不 同 源 的 数据 根据 统一 的 编码 进行 规范 ， 统 一 抽取 到 数据 仓库 中 ， 
而 数据 仓库 将 保证 数据 是 一 性 的 ， 不 会 存在 二 义 性 ， 这 就 是 ETL 的 难点 和 重点 。 








46 主流 的 IL 工具 


选择 合适 的 ETL 工具 是 实际 数据 仓库 项 目 中 必须 要 考虑 的 问题 ， 包 括 使 用 成 本 、 技 术 人 
员 对 此 工具 的 熟练 程度 、ETL 工具 开发 商业 智能 项 目的 成 功 案例 和 工具 广 商 强 有 力 的 抠 术 文 
持 。 在 实际 项 目 中 ， 最 篆 用 的 工具 就 是 PowerCenter 和 Datastage， 一 些 公司 也 用 开源 的 ETL 
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工具 ， 如 Kettle. 


从 本 质 上 来 说 ，ETL 工具 的 功能 都 是 相同 的 ， 都 提 


供 了 一 个 全 面 的 数据 集成 解决 方案 。ETL 工具 的 功能 如 ”| 数据 源 | 数据 转 Es £v 元 数据 
图 4-5 Br 的 支持 | 换 功能 的 管理 
m 人 No 


ETL 工具 可 以 使 用 通用 的 接口 JDBC, ODBC 或 者 
Hao) mim Ng ED dibus, SS f ETL 对 不 同 图 4-5 ETL 工具 的 功能 
数据 源 的 文 持 。 

数据 转换 是 ETL 工具 提供 的 最 强大 的 功能 ， 也 是 ETL 开发 人 员 面 临 的 难度 最 大 的 问题 。 
一 般 来 说 ，ETL 工具 提供 了 各 种 组 件 来 实现 不 同 的 转换 功能 ， 有 行列 转换 、 过 泪 、 排 序 、 汇 
总 、 分 组 、 计 算 等 常用 的 转换 方式 ;同时 可 以 实现 代理 主键 的 生成 ，Mapping 的 调试 功能 ， 
抽取 远程 源 数据 ， 各 种 数据 增 量 加 载 方式 ， 在 转换 过 程 中 还 可 以 文 持 数据 比较 、 次 型 转换 、 
学 段 拆 分 等 功能 ， 数 据 预 谢 ， 数 据 的 批量 钱 载 ， 性 能 监控 ， 目 动 调度 ETL 程序 ， 程 序 出 错 处 
Bh. yis 接 列 的 聚合 汇总 等 功能 ， 

BE ETL 工具 的 发 展 ，ETL 的 管理 和 调度 功能 得 到 了 加 强 。 管 理 功能 包括 ETL 程序 的 
备份 与 恢复 ， 夏 本 升级 和 管理 。 调 度 功 能 包括 命令 触 皮 方式 、 事 件 触发 方式 和 时 间 触 发 方式 。 
目前 很 多 公司 都 在 拓展 ETL 的 集成 性 ; 在 原 有 的 基础 上 网 入 了 公共 的 API, 增加 了 JavaScript 
语言 脚本 和 存储 过 程 的 调用 功能 ， 增 强 了 ETL 工具 的 灵活 性 。 


















































4.7 ETL 的 作用 


智能 数据 仓库 系统 由 数据 仓库 、 数 据 集 市 、 多 维 数据 分 析 组 成 。ETL 的 作用 融 是 解 
MEME ETL 过 程 中 包含 一 些 灵活 的 计算 、 汇 总 、 了 字段 拆 分 、 字 段 合并 、 数 据 
比较 、 过 涯 、 混 合 运 算 等 内 容 ; 还 包括 对 目 定 义 函 数 的 文 持 ， 复 杂 条 件 的 过 滤 ， 数 据 的 批量 


加 载 ， 时 间 类 型 的 转换 ， iicet 型 支持 ， 去 重复 
PN N 者 提供 辅助 决 S e 
策 文 持 。 因 为 数据 来 源 不 统一 ， 格 式 混 乱 、 各 种 类 型 ES 去 重复 记录 和 记录 间 合 并 或 计算 EM 


的 “ 脏 ”数据 都 增加 了 对 数据 集成 整合 的 难度 ， 所 以 ”一 = 
I ad 定义 函数 
需要 ETL 提供 一 个 完整 的 方案 来 解决 数据 一 致 性 和 [| 


集成 性 的 问题 。ETL 的 设计 和 实施 是 商业 智能 项 目 中 E n 


工作 量 最 大 的 部 分 ， 也 是 最 重要 的 工作 内 容 ， 所 以 一 各 条 件 的 过 一 一 
ETL 是 商业 箱 能 的 核心 和 受 现 。 数据 预览 和 性 能 监控 

BE ET NEN 
48 ”详解 EIL 过 程 图 4-6 ETL 工具 可 以 实现 的 转换 要 求 


















































我 们 已 经 知道 ETL 是 将 业务 系统 的 数据 经 过 抽取 、 清 洗 、 转 换 乙 后 加 载 到 数据 仓库 的 过 
程 ,通常 情况 下 ， 整 个 商业 智能 项 目的 ETL 部 分 会 占 整 个 项 目的 3 以上， 所 以 ETL 的 设计 
会 直接 决定 商业 智能 项 目的 成 败 。 下 面 详细 介绍 ETL 中 的 抽取 、 清 洗 、 转 换 、 加 载 等 各 个 音 
分 的 内 容 。 
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4.8.1 ”数据 抽取 


数据 抽取 就 是 从 源 系 统 中 获取 业务 数据 的 过 程 。 数 据 的 抽取 需要 充分 满足 商业 智能 系统 
的 决策 分 析 需 要 ， 为 了 保证 不 影响 系统 的 性 能 ， 数 据 抽取 时 需要 考虑 很 多 因素 ， 包 括 : 抽取 
方式 、 抽 取 时 间 和 抽取 周期 等 内 容 。 例 如 ， 抽 取 方 式 包括 增 量 抽取 、 全 量 抽取 。 抽 取 时 间 应 
该 尽量 在 系统 使 用 的 低 峰 时 段 ， 例 如 夜间 。 抽 取 的 周期 是 根据 业务 的 需求 制定 的 ， 例 如 按 小 
时 抽取 ， 或 者 按 天 、 月 、 季 度 、 年 等 。 在 数据 抽取 之 前 ， 需 要 确定 业务 系统 的 数据 情况 ， 了 
解数 据 量 的 大 小 ， 以 及 业务 系统 中 每 张 表 的 数据 结构 ， 字 段 含义 ， 表 之 间 的 关系 等 信息 ， 当 
搜集 完 这 些 信息 后 ， 才 能 进行 数据 抽取 的 设计 开发 等 工作 。 数 据 抽取 有 下 面 儿 种 情况 : 

D 如 果 业 务 操 作 型 数据 库 和 数据 仓库 之 间 的 数据 库 管 理 系统 完全 相同 ， 只 需要 建立 相应 
的 连接 关系 就 可 以 使 用 ETL 工具 直接 访问 ， 或 者 调用 相应 的 SQL 语句 或 者 存储 过 程 。 

2) 如 果 数 据 仓 库 系统 和 业务 操作 型 数据 库 的 数据 库 管理 系统 不 相同 ， 比 较 人 简单 的 方式 是 
使 用 ETL 工具 导出 成 文本 文件 或 者 Excel 文件 ， 然 后 再 进行 统一 的 数据 抽取 。 

3) 如 果 需 要 抽取 的 数据 量 非 常 庞 大 ， 此 时 必须 考虑 增 量 抽取 。 通 常用 标记 位 或 者 时 间 戳 
的 形式 ， 每 次 抽取 前 首先 判断 是 否 是 抽取 标记 位 或 者 是 当前 最 近 的 时 间 ， 然 后 再 将 数据 源 的 
数据 抽取 出 来 。 
4.8.2 ”数据 清洗 

一 般 情 况 下 ， 数 据 清洗 的 目的 就 是 选择 出 有 缺陷 的 数据 ， 然 后 再 将 它们 正确 化 和 规范 化 ， 
从 而 达到 用 户 要 求 的 数据 质量 标准 。 其 中 数据 缺陷 可 能 包括 以 下 几 种 情况 : 数值 重复 、 数 据 
缺失 、 数 据 错误 、 数 据 范围 混淆 、 存 在 “及 ”数据 和 数据 不 
一 致 性 等 几 种 情况 ， 如 图 4-7 所 示 。 其 中 数值 重复 是 指标 准 
不 唯一 ， 很 多 数值 都 代表 着 相同 的 含义 。 数 据 范围 混 消 是 指 
相同 的 数值 会 应 用 到 不 同 的 场合 中 ， 代 表 着 不 同 的 含义 。 

第 一 步 ， 需 要 跟 业 务 部 门 进行 沟通 交流 ， 为 了 提高 数据 
的 质量 ， 得 到 标准 的 数据 ， 应 该 首先 过 滤 掉 不 符合 业务 要 求 
的 数据 ， 这 些 数 据 都 违背 业务 规则 ， 数 据 清洗 过 程 会 根据 业 
务 规 则 去 修正 这 些 数据 ， 每 个 业务 规则 都 规定 了 数据 必须 满 
足 的 条 件 ， 然 后 通过 ETL 程序 去 修正 这 些 不 符合 业务 规则 的 
数据 。 

第 二 步 ， 为 了 确保 用 于 决策 分 析 的 数据 质量 ， 需 要 跟 用 图 4-7 数据 矶 陷 图 
户 积极 沟通 ， 将 缺失 的 数据 补 全 ， 最 后 才能 过 滤 到 数据 仓库 中 。 而 那些 错误 的 数据 ， 应 该 等 
用 户 完 全 修正 后 再 抽取 。 重 复 的 数据 ， 同 样 应 该 等 用 户 确 认 完毕 后 再 进行 抽取 。 我 们 应 该 理 
解数 据 清洗 是 一 个 非常 费时 、 复 杂 的 工程 ， 需 要 多 个 业务 部 门 的 配合 和 技术 开发 人 员 对 业务 
数据 的 理解 ， 通 过 不 断 修正 问题 和 解决 问题 才能 完成 。 

数据 清洗 的 流程 包括 以 下 几 个 方面 : 

(1) 定义 业务 数据 源 

标识 出 满足 需求 的 数据 源 ， 并 且 决 定 什么 时 候 进 行 数据 清洗 。 

(2) 分 析 业 务 数据 源 


56 




















































































































7) PASCI UIT] CD X 3 E er MEE JA RE X6. xe ETEAE IE TS RIS Sa o 

(3) 将 数据 标准 化 

定义 标准 化 格式 的 数据 ， 并 且 加 以 转换 。 

(4) 通过 业务 规则 修正 错误 数据 

定义 是 盏 为 正确 数据 的 标准 ， 确 定 如 何 处 理 错误 数据 的 方法 。 

(50 合并 数据 

将 属于 同一 实体 的 多 个 数据 进行 合并 ， 合 并 时 应 该 有 去 重 的 功能 。 

(60 忆 结 数据 错误 类 型 

通过 总 结 数 据 出 错 的 类 型 ， 提 局 清洗 程序 的 完整 性 和 正确 性 ， 从 而 降低 数据 出 现 重 大 问 
题 的 可 能 性 。 

数据 清洗 的 流程 图 如 图 4-8 所 示 。 


定义 业务 分 析 业 务 mom 
业务 | 已 > | 分 析 业 务 D» | 将 数据 标准 化 
iL 
NUNC uw 通过 业务 规则 
合并 数据 | <D | 修正 错误 数据 


图 4-8 数据 请 洗 的 流程 图 




















4.8.3 ”数据 转换 


数据 转换 是 指 从 业务 系统 中 抽取 出 源 数据 ， 然 后 再 根据 数据 仓库 模型 的 需求 ， 进 行 一 系 
列 数 据 转换 的 过 程 。 

我 们 已 经 知道 数据 转换 是 整个 ETL 过 程 中 复杂 程度 最 表 4-1 电压 等 级 编码 表 
高 的 过 程 ， 包 括 对 数据 不 一 致 性 的 转换 ， 业 务 指标 的 计算 





和 某 些 数据 的 汇总 ， 为 决策 分 析 系统 提供 数据 支持 其 中 一 一 
对 数据 不 一 致 性 的 转换 就 是 依赖 于 编码 表 的 设计 ， 通 过 电 一 去 
压 等 级 编码 表 ( 见 表 4-1) 将 不 同业 务 系统 中 相同 类 型 的 数 一 一 ; 
据 进行 转换 ， 即 将 各 个 省 市 的 电力 营销 系统 的 电压 等 级 编 一 5 ; 
人 码 标 准 化 ， 例 如 将 110kV 的 编码 统一 设置 成 1220kV 的 编 1000 , 


公设 置 成 2380kV 的 编码 设置 成 3500kV 的 编码 设置 成 
41000kV 的 编码 设置 成 5, 以 消除 数据 仓库 系统 中 数据 存在 
不 一 致 的 可 能 。 

通过 建立 程序 代码 编 写 规 范 ， 与 模型 设计 小 组 共同 制定 编码 规则 ， 不 仅 可 以 提高 数据 模 
型 的 可 靠 性 、 可 读 性 、 可 修改 性 、 可 维护 性 和 一 致 性 ， 而 且 也 会 提高 数据 模型 的 可 继承 性 ， 
促使 每 个 人 的 成 果 可 以 互相 共享 。 同时 也 应 该 建立 公共 的 编码 表 作 为 数据 转换 的 依据 ， 可 以 
根据 编码 表 制 定 的 业务 规则 进行 数据 的 转换 ， 保 证 数据 仓库 系统 内 部 数据 的 一 致 性 。 例 如 ， 
性 别 在 客户 关系 表 中 用 1 和 0 分 别 代表 男 和 女 ， 而 在 单位 员工 表 中 可 能 使 用 m 和 f 区 分 男 和 
女 ， 所 以 需要 对 不 同业 务 表 中 相同 类 型 的 业务 含义 进行 统一 和 规范 。 
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在 转换 过 程 中 ， 对 粒度 的 分 析 也 是 工作 的 重要 组 成 部 分 ， 因 为 存放 到 数据 仓库 中 的 数据 
对 粒度 的 要 求 可 能 不 相同 ， 用 户 需 要 将 低 粒 度 的 数据 汇总 形成 决策 分 析 型 的 数据 ， 同 时 完成 
各 种 数据 指标 的 计算 ， 这 都 需要 经 过 ETL 转换 过 程 。 最 后 一 步 ， 将 转换 后 得 到 的 数据 加 载 到 
数据 仓库 中 ， 以 供 企业 高 层 领导 决策 分 析 时 使 用 。 

ETL 转换 过 程 可 能 包括 以 下 几 个 方面 : 

D 对 空 值 的 处 理 : 如 果 在 转换 过 程 中 捕获 到 茶 些 字段 存在 至 值 ， 在 进行 加 载 时 需要 将 罕 
值 奉 换 成 某 一 数据 或 者 直接 进行 加 载 ， 不 做 任何 转换 。 

2) 对 数据 格式 的 规范 化 : 根据 业务 数据 源 中 各 个 字段 的 数据 类 型 ， 进 行 数据 格式 的 规范 
和 统一 。 例 如 ， 统 一 将 数值 类 型 转化 成 字符 串 交 型 。 

3) 根据 业务 需求 进行 字段 的 拆 分 或 者 合并 。 

4) 对 缺失 数据 的 替换 : 根据 业务 需求 对 缺失 数据 进行 替换 。 

5) 根据 业务 规则 对 数据 进行 过 滤 。 






































6) 根据 编码 表 进 行 数据 唯一 性 的 转换 : 根据 编 但 表 制 定 的 业务 规范 进行 数据 的 转换 ， 实 
现 数 据 仓 库 系 统 内 部 数据 的 一 致 性 。 
ETL 的 转换 过 程 如 图 4-9 所 示 。 


对 空 值 的 处 理 | OY pom 





a 对 缺失 数据 的 
替换 


图 4-9 ETL 的 转换 过 程 





4.8.4 ”数据 加 载 


数据 的 加 载 过 程 就 是 将 已 经 转换 完成 的 数据 ， 存 放 到 目标 数据 库 的 过 程 。 这 是 ETL 过 程 
中 的 最 后 一 步 ， 需 要 保证 加 载 工具 必须 具有 高 效 的 性 能 去 完成 数据 加 载 ， 同 时 还 需要 考虑 数 
据 加 载 的 周期 和 数据 加 载 的 策略 。 数 据 加 载 策略 包括 时 间 蕉 的 加 载 方式 、 全 表 对 比 的 加 载 广 
式 、 通 过 读 取 日 志 表 进 行 加 载 的 方式 、 全 表 删除 后 再 进行 加 载 的 方式 ， 如 图 4-10 所 示 ， 

时 间 惟 的 加 载 方式 是 通过 对 源 系统 的 表 添加 时 间 堆 
字段 ， 将 系统 当前 时 间 和 时 间 戳 的 值 进行 对 比 ， 决 定 哪 
些 业务 数据 需要 被 抽取 ， 可 以 实现 数据 的 递增 加 载 ， 是 



































比较 常见 的 一 种 加 载 方式 。 UR CERO | 
全 表 对 比 的 加 载 方式 是 在 数据 加 载 前 ， 将 每 条 数据 i 
邦 与 目标 表 的 所 有 记录 进行 全 表 对 比 ， 根 据 主键 值 是 盏 图 4-10 数据 加 载 策略 





相同 ， 判 断 数 据 是 更 独 还 是 插入 。 当 数据 量 比 较 大 的 时 
修 ， 有 耗 时 长 、 效 率 低 的 缺点 。 通 常 也 对 全 表 对 比 进行 改进 ， 采 用 版 本 号、 标记 和 字段 等 绥 慢 
变化 维 的 形式 进行 增 量 的 抽取 。 
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读 取 日 忘 表 的 加 载 方式 古 当 源 数 据 表 发 生变 化 时 ， 不 断 更 新 日 志 表 的 信息 ， 日 记 表 的 信 
恩 作为 数据 加 载 的 一 个 依据 ， 但 是 日 志 表 维护 相对 麻烦 ， 会 存在 一 定 风 险 。 

全 表 删 除 后 再 插入 的 加 载 方式 古 在 数据 加 载 前 ， 先 删除 目标 表 的 所 有 数据 ， 然 后 再 去 加 
载 全 部 的 数据 ， 但 是 不 能 实现 数据 的 递增 加 载 ， 效 率 较 低 ， 但 是 实现 方式 相对 简单 。 


48.5 ”ETL 的 日 志 


ETL 的 日 专 功 能 非常 重要 ， 可 以 记录 ETL 执行 过 程 中 的 每 一 步 信息 ， 包 括 运 行 的 起 始 时 
闻 和 结束 时 间 ， 历 史 数 据 的 抽取 记录 ， 数 据 抽 取 的 行 数 和 运行 到 示 一 步 的 出 链 信 息 ， 出 错时 
间 等 内 容 。 当 然 ETL 工具 是 目 动 产生 这 些 日 忘 信息 , 帮助 系统 维护 人 员 进 行 监控 的 , 如 果 ETL 
过 程 中 出 现 错误 ， 将 要 形成 错误 日 志 ， 系 统管 理 员 可 以 通过 邮件 或 者 其 他 方式 接收 到 该 错误 
信息 ， 然 后 对 该 错误 及 时 进行 处 理 。 当 然 我 们 已 经 知道 ETL 的 日 六 信息 也 可 以 作为 数据 加 载 
的 一 个 策略 ， 通 过 读 取 日 志 表 的 形式 有 计划 地 进行 数据 加 载 。 
































4.9 ”ELL 优化 


如 果 数 据 仓库 建设 中 的 ETL 都 是 由 SQL 和 调用 存储 过 程 、 函 数 来 实现 的 ， 那 么 SQL 语 
句 的 性 能 将 直接 影响 ETL 的 效率 。 可 以 将 ETL 优化 分 成 以 下 几 个 部 分 : 

D 面 对 海 量 的 数据 ， 可 以 分 成 不 同 的 时 段 进行 批 量 数据 的 增加 、 删 除 、 人 修改、 查询 。 数 
据 的 抽取 、 清 洗 、 转 换 过 程 可 以 放 到 凌晨 至 早上 8 点 左右 处 理 。 

2) 如 何 采 用 高 效 的 SQL 语句 是 ETL 优化 的 核心 和 重点 。 

3) 如 果 需 要 插入 的 数据 量 很 大 ， 我 们 可 以 考虑 在 插入 数据 前 先 删除 索引 ， 插 入 操作 完毕 
后 再 建立 索引 。 
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ETL 设计 需要 遵循 业务 数据 处 理 的 要 求 ， 根 据 问题 的 多 样 性 和 不 确定 性 ， 在 设计 过 程 中 
TKR FIRU ILR] 4-11): 

1) Æ ETL 设计 之 前 ， 需 要 根据 业务 的 需求 确定 所 要 分 析 的 主题 和 数据 结构 。 根 据 数 据 
仓库 的 模型 ， 考 虑 在 ETL 设计 中 是 否 增加 预 留 字段 和 属性 。 

2) 确定 数据 的 粒度 。 可 以 通过 粗 粒度 减少 数据 的 总 量 ， 也 可 以 根据 细 粒 度 奶 洲 到 最 底层 
的 数据 ， 探 寻 原 因 。 粒 度 的 大 小 是 业务 需求 和 分 析 的 主题 所 确定 的 。 

3) ETL 抽取 周期 的 确定 。 根 据 用 户 的 害 求 ， 在 设计 ETL 之 醒 束 应 该 人 确定 抽取 的 时 间 、 
抽取 的 周期 。 

4) 以 增 量 抽取 的 方式 作为 ETL 设计 的 重点 ， 减 少数 据 抽取 的 压力 和 抽取 的 时 间 。 

5) 通常 数据 的 抽取 和 清洗 可 以 分 成 许多 步骤 ， 根 据 不 同 的 条 件 采用 不 同 的 处 理 逻 辑 。 

6) 对 了 寞 常情 况 的 处 理 。 包 插 网 络 的 中 断 ， 数 据 流 动 过 程 中 各 种 未 知 的 错误 ， 都 需要 通过 
相应 的 措施 去 解决 ， 以 保证 数据 的 正确 性 。 

7) 对 ETL 的 运行 管理 和 监控 措施 。 可 以 使 用 ETL 工具 中 的 管理 监控 组 件 对 ETL 进行 设 
置 ， 方 便 ETL 出 现 寞 常 时 可 以 进行 人 工 干 预 或 者 通过 程序 自动 调度 功能 ， 对 每 一 步 的 错误 
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异常 都 调用 相应 的 处 理 程序 自动 去 解决 ， 以 保证 数据 的 质量 。 
















确定 ETL 
的 处 理 逻 辑 





ETL 的 
运行 管理 
和 监控 






设计 原则 









确定 数据 
的 粒度 


对 异常 情 
况 的 处 理 












以 增 量 






确定 ETL 抽取 方式 
的 运行 周期 | 作为 ETL 的 


设计 重点 


图 4-11 ETL 的 设计 原则 


总 结 : 按照 以 上 设计 原则 ， 可 以 增加 数据 仓库 系统 的 灵活 性 和 扩展 性 ， 你 证 数据 的 正确 
性 ， 降 低 维护 成 本 。 


4.11 ETL 的 框架 结构 
ETL 的 框架 结构 包括 ETL 调度 、 抽 取 策 略 、 转 换 策略 、 加 载 策略 等 ， 如 图 4-12 所 示 。 


它 的 每 一 步 包 括 抽 取 、 转 换 、 加 载 的 信息 都 记录 到 日 专文 件 中 ， 以 便 系 统 维护 人 员 奏 看 ETL 
的 运行 信息 ， 同 时 ETL 又 有 寞 第 处 理 的 功能 ， 对 于 每 一 步 缀 的 弄 第 部 有 相应 的 处 理 流程 。 

















ETL 服务 大 





图 4-12 ETL 框架 结构 图 











统一 调度 是 ETL 中 较为 重要 的 功能 。 通 党 有 以 下 两 种 调度 方式 。 
D 目 动 调度 方式 : 可 以 使 用 ETL 工具 ， 每 天 定时 局 动 后 合 程序 ， 目 动 完 成 ETL 的 处 理 
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流程 和 加 载 过 程 。 

2) 手工 方式 : 用 户 可 以 通过 前 合 应 用 系统 ， 使 用 它 的 监控 功能 对 一 些 ETL 处 理 程序 进 
行 手 工 调度 。 

当然 ， 无 论 采 用 何 种 调度 方式 ， 都 需要 有 报警 和 监控 的 功能 ， 用 来 捉 醒 管理 人 员 在 处 理 
数据 过 程 中 是 否 出 现 错 误 。ETL 框架 结构 是 整个 商业 智能 系统 的 核心 部 分 ， 占 有 重要 地 位 。 











412 ElL 的 实施 策略 


(1) 源 数 据 抽取 条 上 略 
源 数 据 的 抽取 策略 如 图 4713 所 示 : 


。 预 处 理 ， 数据 抽取 
源 数据 完整 性 检查 、 日 期 一 增 量 可 以 按照 指定 字段 的 标 


匹配 检查 等 9— 志 或 时 间 戳 ， 选 择 本 期 增 量 
Lf 数据 抽取 ， 全 量 按照 全 表 数 

| 据 抽取 

源 数据 抽取 策略 


Bl 
E "数据 装载 
将 转换 好 的 数据 保存 到 


目标 库 中 








"数据 标准 化 
按照 标准 化 规范 进行 相应 
的 转换 





图 4-13 源 数 据 抽取 策略 
(2) ETL 数据 加 载 


1) 增 量 数据 处 理 。 增 量 数据 处 理 的 关键 内 容 是 判断 源 系 统 的 增 量 数据 。 对 于 ETL 来 说 ， 
源 系 统 提 供 的 增 量 数据 将 提 局 数据 米 集 的 效率 ， 增 量 数 据 的 几 种 方式 如 图 414 所 示 : 


NT 采用 判断 时 间 发 的 方法 获取 增 量 数据 | 
设置 了 自 增长 的 序列 号 作为 唯一 主键 | 
源 系 统 定义 了 一 个 字段 作为 数据 被 更 改 的 标识 | 
对 于 没有 时 间 戳 的 增 量 数据 ， 数 据 量 不 大 时 ， 可 以 采用 整 表 比较 法 | 





在 源 系 统 数据 表 上 建立 触发 器 ， 一 般 数 据 项 发 生变 化 ， 记 录 到 增 量 表 中 | 


4-14 Js AE 


2) 数据 初始 化 处 理 。 当 源 系 统 较 多 时 ， 需 要 对 各 个 源 系 统 提出 具体 的 要 求 。 在 数据 初始 
化 之 前 ， 应 该 做 好 存储 的 准备 ， 同 时 在 初始 化 过 程 中 应 该 进行 监控 ， 保 证 数据 初始 化 过 程 中 
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的 正常 运行 ， 对 于 拒绝 的 文件 应 该 做 好 记录 ， 通 过 事后 分 析 ， 决 定 是 否 需 要 重新 加 载 。 

3) 错误 处 理 与 恢复 。 在 ETL 过 程 中 ， 对 于 数据 加 载 过 程 中 出 现 的 错误 ， 可 以 利用 作业 
调度 控制 与 监控 对 错误 数据 进行 有 针对 性 的 处 理 。 可 以 在 作业 流程 中 设置 异常 的 条 件 ， 当 错 
误 记 录 超 过 一 定 的 范围 时 ， 需 要 转 为 人 工 处 理 ， 一 般 做 法 是 通过 时 间 愉 删除 本 次 加 载 的 数据 ， 
然后 进行 重新 加 载 。 

(3) 寞 弟 情 况 处 理 策 略 

ETL 过 程 中 发 生 的 异常 如 图 4-15 所 示 : 
































| 
。 由 硬件 、 操 作 系统 和 网 络 导致 的 异常 一 | í COMM ` “由 ETL 过 程 处 理 导致 的 异常 
| 
ETL 过 程 中 发 
、 和 的 异常 


* 由 于 人 工 干预 导致 的 异常 





* 因为 数据 模型 导致 的 异常 





图 4-15 ETL 过 程 中 发 生 的 异常 





处 理 的 策略 包括 : 

D 如 果 发 生 由 硬件、 操作 系统 和 网 络 导 致 的 异常 ，ETL 将 中 断 处 理 ， 故 障 排除 后 ， 可 以 
使 用 手工 的 方式 调整 ETL 过 程 。 

2) 对 于 ETL 过 程 中 发 生 的 数据 质量 问题 ， 依 据 英 射 规则 对 数据 进行 清洗 ， 将 符合 质量 
的 数据 入 库 。 对 不 符合 质量 要 求 的 数据 进行 拒绝 ， 并 且 记 录 拒 绝 的 原因 。 

3) 对 于 数据 模型 导致 的 异常 ，ETL 将 中 断 处 理 ， 当 模型 修改 完成 后 ， 调 整 ETL 程序 ， 
重新 进行 处 理 。 








413 本章 小 结 





1) ETL 是 数据 仓库 项 目 中 最 艰难 晶 耗 时 最 长 的 工作 , ETL 系统 的 设计 和 开发 工作 对 商业 
智能 项 目的 成 败 产 生 人 至 关 重 要 的 影响 ，ETL 是 数据 抽取 (Extract)、 转 换 (Transform), DEX 
(Load) 的 简写 。 

2) ETL 本 质 上 束 是 数据 从 源 到 目标 的 过 程 〈 即 数据 流动 的 过 程 )， 所 以 一 般 ETL 工具 都 
提供 特定 语言 环境 (JavaScript 语言 脚本 和 存储 过 程 的 调用 功能 ) 来 实现 高 级 转换 功能 

3) 元 数据 的 概念 在 数据 仓库 中 非常 重要 ， ETL 中 存在 大 量 的 数据 源 定义 和 映射 规则 、 
这 些 都 是 元 数据 需要 管理 和 存储 的 。 

影响 ETL 数据 质量 的 关键 因素 包括 以 下 几 种 情况 。 
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e 可 能 会 有 一 部 分 数据 因为 客观 或 者 人 为 的 原因 导致 数据 格式 混乱 。 

e 源 系 统 设计 和 存在 个 合理 性 。 

e 在 开发 过 程 中 ， 因 为 开发 人 员 的 错误 或 者 设计 人 员 对 业务 规则 摘 述 的 问题 ， 同 样 会 导 

致 数据 质量 出 现 问 题 。 

50 质量 的 衡量 有 以 下 儿 种 方式 : 定义 的 数据 是 否 和 实际 数值 相同 、 指 标 数据 是 否 符合 
业务 的 规则 、 数 据 是 否 和 业务 源 系统 中 的 信息 保持 一 致 、 数 据 是 个 违 背 目 然 规律 或 者 不 符合 
常理 。 

6) 选择 合适 的 ETL 工具 是 实际 数据 仓库 项 目 中 必须 要 考虑 的 问题 ， 包 括 使 用 成 本 、 技 
术 人 员 对 此 工具 的 熟练 程度 、ETL 工具 开发 商业 智能 项 目的 成 功 和 案例 和 工具 三 商 强 有 力 的 技 
术 文 持 ， 在 实际 项 目 中 ， 我 们 最 常用 的 工具 束 是 PowerCenter 和 Datastage， 一 些 公 司 也 用 开 
WHJ ETL 工具 ， 例 如 Kettle- 

7) ETL 是 将 业务 系统 的 数据 经 过 抽取 、 清 洗 、 转 换 之 后 加 载 到 数据 仓库 的 过 程 ， 通 常情 
况 下 ， 整 个 商业 智能 项 目的 ETL 部 分 会 占 整个 项 目的 3 以 上 ， 所 以 ETL 的 设计 会 直接 决定 
商业 智能 项 目的 成 败 。 

8) 数据 清洗 的 流程 包括 以 下 几 个 方面 : 定义 业务 数据 源 、 分 析 业 务 数 据 源 、 将 数据 标准 
化 、 通 过 业务 规则 修正 错误 数据 、 合 并 数据 、 总 结 数据 错误 类 型 、 转 换 和 加 载 。 

9) ETL 转换 过 程 可 能 包括 以 下 几 个 方面 : 对 衬 值 的 处 理 、 对 数据 格式 的 规范 化 、 根 据 业 
务 需 求 进行 子 段 的 拆 分 或 者 合并 、 对 缺失 数据 的 伏 换 、 根 据 业 务 规则 对 数据 进行 过 小 、 根 据 
编码 表 进 行 数 据 唯 一 性 的 转换 。 

10) 通常 ETL 的 数据 加 载 策略 包括 : 时 间 惟 的 加 载 方式 、 全 表 对 比 的 加 载 方式 、 通 过 读 
取 日 志 表 进行 加 载 的 方式 、 全 表 删 除 后 再 进行 加 载 的 方式 。 

11) ETL 的 日 志 功能 非常 重要 ， 可 以 记录 ETL 执行 过 程 中 的 每 一 步 信 息 ， 包 括 运行 的 起 
始 时 间 和 结束 时 间 ， 历 史 数 据 的 抽取 记录 ， 数 据 抽 取 的 行 数 和 运行 到 茶 一 步 的 出 错 信 息 ， 出 
音 时 间 等 内 容 。 

12) 采用 高 效 的 SQL 语句 是 ETL 优化 的 核心 和 重点 。 

13) ETL 框架 结构 主要 包括 ETL 调度 、 抽 取 策 略 、 转 换 策 略 、 加 载 策略 等 。 

14) 统一 调度 是 ETL 中 较为 重要 的 功能 。 通 常 有 两 种 调度 方式 : 

e 目 动 调度 方式 : 可 以 使 用 ETL 工具 ， 每 天 定时 启动 后 从 程序 ， 目 动 完 成 ETL 的 处 理 





$ 








$ 













































































流程 和 加 载 过 程 。 
e 手工 方式 : 用 户 可 以 通过 前 台 应 用 系统 , 使 用 它 的 监控 功能 对 一 些 ETL 处 理 程序 进行 
手工 调度 。 


63 


第 5 革 FE EE HEIDDLAT Dr ABPRPRIE IRI TT 


本 章 目标 
本 章 将 重点 介绍 商业 智能 联机 分 析 处 理 COnLine Analysis Processing, OLAP) 的 理论 知 
W, 包括 OLAP 的 核心 概念 ，OLAP 发 挥 了 什么 样 的 作用 ，OLAP 与 OLTP 的 区 别 ，OLAP 的 
实现 方法 和 实施 过 程 等 内 容 。 
学 习 本 章 后 ， 您 将 掌握 : 
@ OLAP 的 定义 。 
OLAP 系统 和 OLTP 系统 的 区 别 。 
OLAP 系统 的 基本 目标 和 特点 。 
OLAP 系统 和 数据 仓库 系统 的 关系 。 
OLAP 系统 的 实施 过 程 。 
OLAP 模型 的 设计 与 实现 。 


5.1 OLAP 介绍 


OLAP 系统 能 够 帮助 决策 分 析 人 员 从 多 个 角度 分 析 数 据 。 要 想 理解 OLAP 的 概念 ， 必 须 
先知 道 以 下 几 个 重要 的 概念 。 

D 维度 : 人 们 观察 事物 的 角度 ， 例 如 地 区 维度 、 时 间 维 度 、 产 品 维度 等 。 

2) E: 根据 维度 细节 程度 的 不 同 ， 划 分 数据 在 好 辑 上 的 等 级 关系 ， 用 来 描述 维度 的 各 
个 方面 。 例如， 时 间 维 度 包 括 和 年、 季度、 月、 日 等 层次 ， 地 区 维度 包括 国家 、 省 、 市 、 县 等 
层次 。 

维度 和 层次 的 关系 如 图 5-1 所 示 。 

3) 维度 的 成 员 : 维度 的 取 值 ， 即 维度 中 的 各 个 数据 元 素 的 取 值 。 例 如 ， 地 区 维度 中 具体 
的 成 员 有 英国 、 法 国 、 德 国 、 西 班 牙 。 

维度 和 维度 成 员 的 关系 如 网 5-2 Dro» 


























图 5-1 维度 和 层次 的 关系 图 5-2 ”维度 和 维度 成 员 的 关系 


4) 钻 取 :通过 变换 维度 的 层次 ， 改 变 粒度 的 大 小 。 它 包括 向 上 钻 取 Drill Up》 和 向 下 
钻 取 (Drill Down)。 向 上 钻 取 是 将 细节 数据 向 上 追溯 到 最 高 层次 的 汇总 数据 。 向 下 钻 取 是 将 
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最 高 层次 的 汇总 数据 深入 到 最 低层 次 的 细节 数据 中 。 

5) 旋转 : 通过 变换 维度 的 方向 ， 重 新 安排 维 的 位 置 ， 例 如 行列 互 换 。 

6) 切片 和 切 块 : 在 一 个 或 者 多 个 维度 上 选取 固定 的 值 ， 分 析 其 他 维度 上 的 上 度量 数据 。 如 
果 其 他 维度 剩余 两 个 ， 则 是 切片 ， 如 果 是 3 个 ， 则 是 切 块 。 

7) EE: 多 维 数据 的 取 值 。 例 如 ， 销 售 额 、 利 润 。 

8) ROLAP: 是 基于 关系 数据 库 的 OLAP， 以 关系 型 数据 库 为 基础 ， 对 多 维 数据 的 存储 。 

9) MOLAP: 是 基于 多 维 数据 库 的 OLAP， 其 中 切片 、 切 块 是 主要 技术 。 

100 HOLAP: 是 基于 关系 型 和 多 维 矩 阵型 等 混合 型 的 OLAP 实现 。 

总 结 : OLAP 系统 能 够 针对 决策 分 析 人 员 和 企业 管理 人 员 从 多 个 角度 对 数据 进行 分 析 。 
METAPH ARES, OLAP 的 应 用 越 来 越 广泛 ， 它 可 以 从 不 同 的 角度 去 分 析 各 种 指标 ， 
例如 当 分 析 企 业 利 油 指标 时 ， 可 能 综合 时 间 维 度 、 地 区 维度 、 产 品类 别 维 上 度 、 客 户 类 别 维度 
等 多 种 因素 来 衡量 利润 的 值 是 多 少 ， 最 后 通过 报表 进行 展示 。OLAP 的 最 大 特点 就 是 通过 多 
维 模型 ， 用 户 可 以 动态 地 从 多 个 角度 分 析 数 据 ， 增 加 了 分 析 的 灵活 性 和 时 效 性 ， 大 大 提高 了 
企业 管理 的 效率 ， 这 是 OLAP 发 展 的 根本 原因 。 





























9.2. OAP 系统 与 QLIP 系统 的 区 别 








OLTP 【在线 联机 事务 处 理 ) 系统 主要 面 问 细节 性 的 数据 ， 存 储 的 都 是 当前 的 数据 ， 用 来 
文 持 日 党 业务 运作 。 这 些 数据 都 是 可 以 更 新 的 ， 数 据 处 理 量 相对 较 小 。OLAP 系统 主要 是 综 
合 的 、 并 且 经 过 提炼 的 数据 ， 它 的 数据 主要 是 历史 数据 ， 不 可 修改 ， 数 据 处 理 量 相对 较 大 ， 
主要 面向 决策 分 析 处 理 。 它 们 的 区 别 如 图 5-3 所 示 。 


OLTP 系统 OLAP 系统 











。 细 方 性 数据 。 综合 和 经 过 提炼 的 
。 当 前 数据 数据 
。 可 更 新 的 e 历史 数据 


。 数 据 处 理 量 较 小 e 不 可 修改 
。 面 向 事务 处 理 e 数据 处 理 量 较 大 
。 面向 业务 操作 人 员 e 面 辣 决 策 分 析 处 理 
e 面向 决策 管理 层 人 员 








图 5-3 OLTP 系统 和 OLAP 系统 的 区 别 


9.9. OLAP 的 实现 方法 





OLAP 有 多 种 实现 方法 , 根据 存储 数据 方式 的 
不 同 ， 可 以 分 为 ROLAP、MOLAP、HOLAP， 如 
图 5-4 所 示 。 

ROLAP (Relational OLAP) 表示 基于 关系 型 
数据 库 的 OLAP 实现 。 它 的 技术 依赖 于 关系 型 数 
据 ， 以 关系 型 数据 库 为 核心 ,以 关系 型 结构 对 多 维 ”图 574 根据 存储 方式 划分 的 OLAP 的 实现 方法 
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数据 进行 数据 存储 和 展现 。 通 种 ROLAP 将 多 维 数据 分 成 事实 表 和 维 表 ， 事 实 表 存储 的 都 是 
指标 数据 和 维 表 的 关键 字段 什 ， 维 表 多 数 存 储 维度 的 层次 、 维 度 的 成 员 值 等 信息 。 维 表 和 事 
实 表 通过 主 外 关键 字 关 联 在 一 起 ， 形 成 了 星 形 模式 ， 如 图 5-5 所 示 。 对 于 层次 复杂 的 维 ， 可 
以 使 用 多 个 表 来 描述 ， 这 种 对 星 形 模式 的 扩展 称 为 雪人 花形 模式 。 事 实 表 以 存储 的 产品 ID、 产 
品类 型 ID、 地 址 ID 和 时 间 ID 作为 天 联 维 表 的 关键 子 段 ， 以 销售 数量 作为 指标 数据 。 维 表 有 
产品 维 表 、 时 间 维 表 、 产 品 关 型 维 表 、 地 址 维 表 ， 地 址 维 表 又 包括 国家 、 省 级 、 地 市 等 维 表 ， 
图 5-6 所 示 。 通 过 最 大 限度 地 减少 数据 存储 量 以 及 关联 较 小 的 维 表 来 改善 数据 奏 询 的 性 能 ， 
是 典型 的 雪人 花形 模 式 。 
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维 表 


产品 ID 
i 产品 类 型 ID 
地 址 ID 


时 间 ID 
销售 数量 





图 5-5 ROLAP 的 多 维 关 系 图 ( 星 形 模式 ) 
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维 表 










产品 ID 
产品 类 型 DD 


地 址 ID 
时 间 ID 


省 级 名 称 






地 市 维 
地 市 键 
地 市 名 称 





图 5-6 ROLAP 的 多 维 关 系 图 〈 雪 花形 模式 ) 


00 





MOLAP (Multidimensional OLAP) 表示 基于 多 维 数据 的 OLAP 实现 。 它 的 技术 手段 主要 
有 “ 切 块 ” 和 “切片 ” 数据 检索 速度 较 快 ， 但 是 生成 立方 体 的 时 间 较 长 ， 数 据 存储 在 多 维 立 
方 体 中 。MOLAP 多 维 立 方 体 如 图 5-7 Pros 

















图 5-7 MOLAP 多 维 立 方 体 











HOLAP (Hybrid OLAP) 表示 基于 混合 型 的 OLAP 实现 。 它 的 技术 主要 结合 MOLAP 和 
ROLAP 两 种 技术 的 优点 。 





5.4 OLAP 的 基本 目标 和 特点 





OLAP 的 基本 目标 就 是 支持 决策 分 析 和 多 维 数据 查询 。OLAP 通过 对 信息 的 各 种 形式 的 
存 取 ， 满 足 企 业 决 策 人 员 和 管理 人 员 对 复杂 查询 的 处 理 ， 并 量 将 结果 提供 给 决策 分 析 人 员 ， 
使 他 们 对 企业 的 运营 状况 有 更 深入 的 了 解 ， 能 够 制定 出 正确 的 决策 方针 。OLAP 是 引领 企业 
发 展 的 灯塔 。 

OLAP 系统 的 特点 包含 以 下 儿 个 方面 : 

D 丰富 的 报表 展示 功能 : OLAP 系统 一 般 有 丰富 的 
报表 展示 功能 ， 例 如 柱 形 图 、 折 线 图 、 人 饼 形 图 。 

2) 数据 访问 和 多 维 分 析 的 能 力 : 提供 给 用 户 数据 访 
问 和 多 维 分 析 的 能 力 ， 并 以 用 户 希 望 的 方式 进行 展示 。 

3) 快速 的 数据 分 析 能 力 : OLAP 系统 有 秒 级 的 数据 


分 析 能 














Dos 数据 访问 
OLAP 的 特点 如 图 5-8 所 示 。 和 多 维 分 
能 力 析 的 能 





9.9 Æ OLAP 的 过 程 


K| 5-8 OLAP 的 特点 


建立 OLAP 的 过 程 如 图 5-9 所 示 。 
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定义 ROLAP 模型 


NM 
设计 星 型 模型 
lll raa 


Ll 





图 5-9 建立 OLAP 的 过 程 


9.0 OAP 与 数据 仓库 的 关系 


为 了 提高 OLAP 系统 的 效率 ， 设 计数 据 仓 库 时 应 该 考虑 如 下 因素 : 

D 为 事实 表 和 维度 表 中 的 关键 字 创 建 索 引 ， 以 提高 数据 查询 的 效率 。 同 一 类 数据 尽 可 能 
使 用 一 个 事实 表 ， 以 减少 表 之 间 的 关联 。 

2) 事实 表 中 尽量 不 要 包含 汇总 类 型 的 数据 。 

3) 维 表 的 设计 应 该 符合 第 三 范式 的 约束 ， 维 表 中 不 要 存储 无 关 的 数据 。 

4) 数据 仓库 设计 的 好 坏 直 接 影 响 建 立 OLAP 系统 的 难 易 程度 和 效率 ， 同 时 OLAP 系统 
又 是 数据 仓库 系统 的 一 种 多 维 展现 方式 。 




















9.1. OLAP 系统 的 实施 过 程 


OLAP 系统 的 实施 一 般 过 程 〈 见 图 5-100. 包括 以 下 几 个 步 又: 


SP nen en en en en en en nn 


ODSA ODS 统一 信息 视图 区 ` 


源 系 统 


/ 
I 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 





一 一 一 一 


1 
| 
EN 






OLAP 服 务 器 : 多 维 化 处 理 
N S 


图 5-10 OLAP 系统 的 实施 过 程 


1) 源 系统 经 过 ETL 过 程 装载 到 ODS 数据 缓冲 区 中 ， 目 的 是 将 所 有 的 业务 数据 集成 起 来 。 
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2) 从 ODS 数据 缓冲 区 中 将 数据 抽取 到 ODS 统一 信息 视图 区 ， 目 的 是 使 用 户 能 够 通过 
ODS 统一 信息 视图 区 获得 跟 某 个 主题 域 相关 的 实时 数据 。 

3) 将 数据 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 中 。 

4) 数据 集 市 里 的 数据 在 数据 仓库 中 经 过 转换 、 汇 总 计算 获取 ， 直 接 支撑 OLAP 多 维 分 析 。 

5) OLAP 系统 文 持 多 维 数据 分 析 。 

需要 注意 的 是 ，ODS 数据 绥 冲 区 和 ODS 统一 信息 视 网 区 可 以 合并 成 一 个 ， 同 时 具有 数 
据 缓冲 和 集成 的 功能 。 


98 OLAP 模型 的 设计 与 实现 


























(Oo 了 解 用 户 的 需求 

作为 解 次 方案 的 提供 者 ， 我 们 需要 理解 业务 规则 ， 了 解 当前 的 业务 状况 ， 不 仅 需 要 和 系 
统 相 关 人 员 进 行 交 流 ， 还 需要 和 系统 的 设计 者 和 开发 者 进行 沟通 。 首 和 完 ， 对 用 户 进 行 分 类 ， 
理解 用 户 对 数据 的 可 用 性 和 访问 速度 的 要 求 ， 第 二 ， 需 要 了 解 不 同 用 户 对 系统 的 访问 频率 ， 
每 闫 用 户 的 数量 和 需要 分 析 的 数据 量 是 多 少 ;， 第 三 ， 需 要 大 致 清楚 系统 的 数据 总 量 应 该 是 多 
少 。 当 我 们 已 丝 了 解 了 用 户 和 数据 源 的 基本 情况 后 ， 可 以 考虑 系统 能 够 满足 客户 的 需求 是 哪 
些 。 用 户 、 开 发 者 、 官 理 者 是 通过 需求 文档 进行 交流 沟通 的 ， 如 图 5-11 Brass rg Hl dS 
的 问题 就 是 开 肥 者 是 否 完成 了 需求 文档 所 要 求 的 功能 特性 。 
管理 者 
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HA 
b 


开发 者 
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图 5-11 了 解 用 户 的 需求 


(2) 好 辑 模 型 的 设计 

通 第 所 说 的 数据 模型 一 般 有 两 个 层次 迪 辑 层 、 物 理 层 。 远 男模 型 揪 述 现实 世界 的 内 在 
规律 和 业务 规则 。 物 理 模型 描述 数据 库 内 部 存储 的 其 体 实 现 。OLAP 模型 是 一 个 逻辑 概念， 
主要 是 对 数据 进行 多 角度 的 分 析 ， 以 便 为 企业 决 宽 者 和 管理 者 提供 各 种 信息 和 知识 “多维 结 
构 ” 是 OLAP 世界 的 核心 ， 而 多 维 模型 通过 维度 、 层 次 、 上 度量 三 者 之 间 的 关系 分 析 数 据 。 举 
例 来 说 ， 如 东 有 一 个 销售 系统 ， 上 度量 值 可 能 包括 销售 额 、 成 本 、 利 润 ， 维 度 包括 时 间 、 产 品 
类 型 。OLAP 涵 辑 模型 的 设计 就 像 是 桥 娄 ， 一 中 是 用 户 的 需求 ， 吃 一 端 是 业务 数据 源 。 销 售 
售 、 成 本 、 利 润 是 需要 展现 、 存 储 的 内 容 ， 随 看 时 间 、 产 品类 型 的 变化 而 变化 。 
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(3) OLAP 的 分 析 过 程 

首先 根据 逻辑 模型 定义 OLAP 多 维 模型 ， 在 定义 模型 的 过 程 中 ， 需 要 根据 业务 需求 定义 
立方体” 分 析 方 法 有 “切片 ”和 “ 切 块 ”” 例如 ， 在 “和 利润、 地区、 时间” 三 维 立方 体 中 进 
行 切 块 和 切片 ， 可 得 到 各 地 区 、 各 产品 的 销售 利润 情况 ， 如 图 5-12 所 示 。 




















o 利润 
日 销售 额 





图 5-12 商业 智能 OLAP 的 例子 


9.0 本章 小 结 


1) OLAP 是 联机 分 析 人 处 理 ， 上 严 文 名 称 OnLine Analysis Processing. OLAP 系统 能 够 帮助 
决策 分 机 人 员 从 多 个 角度 分 析 数 据 。 

2) OLTP 在 线 联机 事务 处 理 ) 系统 主要 和 面 回 细 市 性 的 数据 ， 存 储 的 都 是 当前 的 数据 ， 
用 来 支持 日 党 业务 运作 。 这 些 数 据 都 是 可 以 更 狐 的 ， 数 据 处 理 量 相对 较 小 。OLAP〔 联 机 分 
析 处 理 ) 系统 主要 是 综合 的 、 并 且 经 过 提炼 的 数据 ， 它 的 数据 主要 是 历史 数据 ， 不 可 修改 ， 
数据 处 理 量 相对 较 大 ， 主 要 面 问 决策 分 析 处 理 。 

3) OLAP 有 多 种 实现 方法 ， 根 据 存储 数据 的 方式 不 同 ， 可 以 分 为 ROLAP、MOLAP、 
HOLAP. 

4) OLAP 系统 的 特点 包含 以 下 几 个 方面 : 丰 军 的 报表 展示 功能 、 数 据 访 问 和 多 维 分 析 的 
能 力 、 快 速 的 数据 分 析 能 

5) OLAP 模型 的 设计 与 实现 包括 了 解 用 户 的 需求 、 逻 辑 模型 的 设计 、OLAP 的 分 析 过 程 。 
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4s 6t — sn] AAEE AA 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 什么 十 数据 可 视 化 分 析 。 

e 数据 可 视 化 分 析 的 表现 形式 。 


6.1. 什么 是 数据 可 视 化 分 析 


数据 可 视 化 分 析 是 指数 据 用 各 种 图 像 处 理 搁 术 ， 将 数据 转化 成 各 种 图 表 的 方法 和 手段 。 
例如 数据 可 以 用 饼 图 、 黎 点 图 、 和 直方 图 和 柱状 图 等 方式 进行 展示 。 它 们 是 数据 可 视 化 的 基础 。 
但 是 面 对 复杂 的 数据 集 ， 比 如 财务 报表 ， 用 户 行 为 数据 可 以 用 立体 、 多 维 或 者 动态 实时 的 方 
了 进行 展示 。 数 据 可 视 化 本 身 可 以 看 做 是 一 门 乞 术 。 

数据 可 视 化 分 析 的 特点 如 网 6-1 所 示 : 

















用 户 和 数据 之 间 的 交互 性 多 维 性 
通过 交互 的 方式 管理 和 使 用 户 可 以 用 多 个 角度 去 分 
用 数据 ， 通 过 图 表 或 者 多 析 数 据 


维 图 形 的 方式 对 数据 进行 
可 视 化 分 析 





图 6-1 数据 可 视 化 分 析 的 特点 


数据 可 视 化 分 析 的 功能 : 

1) 通过 可 视 化 拉 术 ， 辅 助 进行 数据 关联 分 析 。 

2) 通过 可 视 化 技术 ， 识 别 和 预测 活动 ， 帮 助 管理 层 人 员 做 出 及 时 和 准确 的 决 倘 。 

数据 可 视 化 的 过 程 : 

复杂 的 数据 可 视 化 过 程 包括 : 数据 的 采集 、 分 析 和 挖掘 等 一 系列 的 过 程 。 然 后 再 由 技术 
人 员 以 立体 、 多 维 或 者 实时 动态 的 方式 将 数据 展示 出 来 。 

数据 可 视 化 的 目的 : 

数据 的 可 视 化 是 为 了 观察 和 跟 踩 各 种 数据 ， 可 以 生成 实时 的 、 可 读 性 强 的 图 表 。 分 析 数 
据 ， 生 成 交互 式 的 图 表 。 发 现 数据 之 间 的 潜在 关系 ， 可 以 生成 多 维 图 表 ， 多 角度 的 分 析 数 据 。 
帮助 用 户 深 刻 地 理解 数据 的 含义 和 变化 。 























71 


0.2. 数据 可 视 化 的 表现 形式 


数据 可 视 化 可 以 有 多 种 表现 形式 ， 如 图 6-2、6-3、6-4 所 不: 





18.5% 











84.3% 
0% 20% 40% 60% 80% 100% 
图 6-2 数据 可 视 化 的 表现 形式 之 一 
| Orango 
[—] Apple 


—*—- Banana 





Jan Feb Mar Apr 





图 6-4 ”数据 可 视 化 的 表现 形式 之 三 


"2^ 


0.3 x 


1) 数据 可 视 化 分 析 古 指 用 各 种 图 像 处 理 拉 术 ， 将 数据 转化 成 各 种 图 表 的 方法 和 手段 。 例 
如 数据 可 以 用 饼 图 、 敌 点 图 、 直 方 图 和 柱状 图 等 方式 进行 展示 。 

2) 数据 可 视 化 分 析 的 功能 : 

e 通过 可 视 化 技术 ， 辅 助 进行 数据 关联 分 析 。 

e 通过 可 视 化 拉 术 ， 识 别 和 预测 活动 ， 帮 助 蜗 层 人 员 做 出 及 时 和 准确 的 决策 。 
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A7 大 数据 理论 知识 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 大 数据 的 概念 。 

e KA TS HIST. 

e 大 数据 的 处 理 扩 术 。 

e 大 数据 和 传统 商业 智能 的 结合 。 


T4. 大 数据 概念 的 提出 


根据 IDC 的 监测 数据 ， 人 类 产生 的 数据 量 正在 呈 指 数 级 的 增长 ， 大 约 是 每 两 年 翻 一 炙 ， 
这 童 味 看 人 类 在 最 近 两 年 产生 的 数据 量 相 当 于 之 前 产生 的 全 部 数据 量 。 大 量 新 数据 源 的 出 现 
则 导致 了 非 结构 化 和 半 结 构 化 数据 爆炸 式 增 长 。 这 些 由 我 们 创造 出 来 的 数据 ， 已 经 远 远 超越 
了 人 力 所 能 处 理 的 范畴 ， 大 数据 时 代 正 在 来 临 。 

其 中 最 早 提出 “大 数据 ”时 代 已 经 到 来 的 机 构 是 兰 名 咨询 公司 妆 肯 锡 。 在 2011 F, ZA 
锡 出 版 了 研究 报告 《大 数据 : 创新 、 苋 争 和 生产 力 的 下 一 个 新 领域 》;， 从 那 时 起 “大 数据 ”已 
经 得 到 了 广泛 的 关注 度 。 

支 肯 锡 在 研究 报告 中 指出 ， 数 据 渗 透 到 每 一 个 行业 和 闻 务 职能 领域 ， 例 如 政府 、 教 育 、 
金融 、 电 力 、 公 检 法 、 制 造 业 、 和 零售 业 、 公 共事 业 、 贸 易 和 交通 等 ， 如 图 1-1 Br: 



























- 
图 7-1 大 数据 涉及 的 行业 
大 数据 逐渐 成 为 重要 的 生产 因 系 ， 特 别 是 互联 网 、 物 联网 、 移 动 互联 网 和 云 计 算 技术 的 
兴起 ， 使 得 人 类 社会 的 数据 增长 量 比 以 前 任何 一 个 时 期 部 快 。 所 以 随 看 社会 的 发 展 和 进步 ， 
众生 了 全 新 的 概念 : 大 数据 。 
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12 什么 是 大 数据 ? 


大 数据 是 一 个 涵 兰 多 种 技术 的 概念 ， 是 指 无 法 在 一 定时 间 内 用 普通 软件 对 其 内 容 进 行 抓 
取 和 管理 的 数据 的 集合 。 大 数据 可 以 包含 结构 化 、 半 结构 化 和 非 结构 化 数据 。 

结构 化 数据 主要 存储 在 关系 型 数据 库 中 ， 这 些 年 一 直 主 导 看 IT 应 用 。 

羊 结构 化 数据 主要 包括 电子 邮件 、 文 本 文件 以 及 网 络 新 闻 等 内 容 。 

非 结构 化 数据 主要 广泛 存在 于 社交 了 网络、 物 联网 和 电子 商务 中 。 随 独 移动 互联 网 和 传 感 
髓 等 技术 的 发 展 ， 据 估计， 未 来 超过 80% 的 数据 属于 非 结构 化 数据 。 大 数据 孕育 了 巨大 的 市 
场 机 会 。 

IBM 公司 将 “大 数据 ”定义 为 4V 类 型 , 即 数量 (Volume)、 多 样 性 (Variety)、 速度 (Velocity ) 
及 数据 的 准确 性 (Veracity)， 如 图 7-2 所 示 。 



































.数量 .多 样 性 
数量 是 与 大 数据 最 相关 的 特 多 样 性 是 指 不 同类 型 的 数据 
征 ， 为 了 提高 企业 中 的 决策 和 数据 源 。 多 样 性 是 指 多 种 
能 力 ， 而 试图 利用 海量 的 数 | 数据 类 型 的 复杂 性 ， 包 括 结 
据 。 数 据 量 以 前 所 未 有 的 束 构 化 、 半 结构 化 和 非 结构 化 
度 增加 数据 

"速度 精确 性 
海量 数据 在 创建 、 处 理 和 分 - — 

析 的 速度 在 加 快 ， 目 前 ， 数 Ure RE. e o. 

据 以 传统 系统 不 可 能 达到 的 不 确定 性 尽管 存在 不 确定 性 

速度 在 疡 生 、 获 取 、 和 存储 和 数据 仍然 包含 宝贵 的 信息 。 确 

分 析 认 并 接收 不 确定 性 的 需求 是 大 
数据 的 特点 


图 7-2 大 数据 的 符 扣 


数量 (Volume): 即 数据 量 。 数 量 是 与 大 数据 最 相关 的 特征 ， 为 了 提高 企业 中 的 决策 能 
力 ， 而 试图 利用 海量 的 数据 ， 所 需 数 据 量 以 前 所 未 有 的 速度 增加 。 

BFE (Variety): 多 样 性 是 指 多 种 数据 类 型 的 复杂 性 ， 包 括 结构 化 、 半 结构 化 和 非 结构 
化 数据 。 随 看 传 感 占 、 各 种 智能 设备 技术 的 烽 炸 性 增长 ， 数 据 的 类 型 无 以 计数 ， 包 括 : 文本 、 
微 博 、 博 客 、 音 频 、 视 频 、 各 种 网 络 点 击 流 、 传 感 右 数据 、 日 总 文件 、 邮 件 等 非 结 构 化 数据 
的 增长 率 达 80%， 而 传统 的 数据 形式 ， 多 半 是 数据 库 表 和 XML。 

速度 (Velocity): 加 快 海量 数据 在 创建 、 处 理 和 分 析 的 速度 。 例 如 实时 的 股票 行情 分 析 、 
路 况 信息 分 析 。 数 据 产生 的 速度 已 超 乎 人 们 的 想象 。 

精确 性 (Veracity): 有 些 数 据 具 有 不 确定 性 ， 例 如 天 气 变 化 、 经 济 情 况 。 这 些 数 据 时 虽 
然 存 在 不 确定 性 ， 但 古 仍然 包含 宝 贯 的 信息 。 


1.3 ”大 数据 处 理 技术 


丹麦 Vestas， 排 名 世界 第 一 的 风力 发 电机 企业 ， 通 过 Hadoop 技术 实现 2.6PB 的 天 气 数 据 
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Hadoop 大 数据 处 理 扩 术 实质 上 是 通过 分 布 式 的 处 理 ， 实 现 对 大 数据 的 操作 。 它 是 以 一 种 

可 乱 、 稳 定 、 高 效 和 可 伸缩 性 的 方式 对 数据 进行 处 理 。 它 可 以 维护 多 个 工作 数据 副本 ， 以 确 

保 针 对 失败 的 节点 可 以 重新 分 布 处 理 。 同 时 Hadoop 是 高 效 的 , 它 通 过 并 行 处 理 加 快 处 理 速度 。 


14 大 数据 应 用 案例 


下 面 ， 我 们 列举 一 些 大 数据 应 用 条 例 。 

TEGERE PURUS ANT: 根据 社交 浆 体 的 评论 ， 分 析 影 啊 客户 的 关键 问题 。 

对 客户 的 保留 : 利用 非 结构 化 数据 ， 例 如 电子 邮件 、 客 尸 调查 等 信息 ， 改 进 客户 流失 横 
型 ， 对 客户 流失 进行 预警 。 

市 场 趋势 分 析 : 通过 社交 媒体 的 评论 、 新 闻 信 息 和 其 他 公共 信息 ， 识 别 出 改 变 商 品 价值 
和 交易 行为 的 潜在 因子 。 

实时 欺诈 分 析 : 实时 分 析 更 多 的 欺诈 数据 。 

贷 葡 风险 评 佑 : 对 各 种 结构 化 和 半 结 构 化 的 数据 ， 例 如 公共 文档 、 监 管 文 档 和 合同 信息 
等 内 容 ， 目 动 效 取 对 贷款 风险 的 评估 和 洞 色 。 


1.9 大 数据 和 传统 两 业 智 能 的 结合 


为 了 解决 海量 数据 的 存储 处 理 ， 可 以 建设 大 型 数据 仓库 及 其 文 撑 运 行 的 各 种 软 使 件 系统 
和 设备 。 但 是 面 对 当 前 数据 的 增长 速度 ， 传 统 的 数据 库 、 数 据 仓 库 和 BI 工具 已 不 能 够 很 好 地 
处 理 和 分 析 挖 据 这 些 大 数据 。 所 以 在 云 计算 模式 、 分 布 式 技术 的 发 展 和 应 用 中 ， 转 化 成 新 的 
商业 智能 系统 ， 这 也 完成 了 大 数据 和 传统 商业 智能 的 结合 。 

新 型 商业 智能 除了 文 持 商业 智能 的 需求 ， 同 时 可 以 促进 商业 智能 的 发 展 以 面 对 商 业 运 作 
的 变化 。 
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1) 大 数据 是 一 个 涵盖 多 种 技术 的 概念 ， 是 指 无 法 在 一 定时 间 内 用 普通 软件 对 其 内 容 进 行 
抓 取 和 管理 的 数据 的 集合 。 大 数据 可 以 包含 结构 化 、 半 结构 化 和 非 结构 化 数据 。 

2) IBM 公司 将 “大 数据 ”定义 为 AV 类 型 ， 即 数量 (Volume), ZI% (Variety) IE 
(Velocity) 及 数据 的 准确 性 〈Veracity )。 

3) 云 计算 模式 、 分 布 式 技术 的 发 展 和 应 用 中 ， 转 化 成 新 的 商业 智能 系统 ， 这 也 完成 了 大 
数据 和 传统 商业 智能 的 结合 。 
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ss 85 “商业 短 能 元 数据 理论 知识 


本 章 目标 
为 了 理解 商业 智能 的 目标 ， 首 先 应 该 熟悉 元 数据 的 基本 知识 。 通 过 本 章 的 学 习 ， 我 们 应 
该 了 解 商业 智能 元 数据 的 基本 概念 和 特点 。 
学 习 本 章 后 ， 您 将 掌握 : 
e 元 数据 的 定义 。 
元 数据 的 框架 结构 。 
元 数据 的 类 型 
元 数据 的 作用 。 
元 数据 的 管理 。 
元 数据 包含 的 内 容 。 


8.1 元 数据 的 定义 


在 商业 智能 领域 中 ， 元 数据 被 定义 为 :在 数据 仓库 系统 的 建立 、 维 护 、 管 理 和 使 用 过 程 
中 ， 用 以 描述 实际 数据 的 信息 ， 它 是 关于 数据 的 数据 。 在 商业 智能 系统 的 建设 过 程 中 ， 元 数 
据 占 有 非常 重要 的 地 位 ， 它 不 仅 定义 了 数据 仓库 的 许多 对 象 ， 例 如 表 结 构 、 所 有 的 字段 列 等 
属性 ， 还 包括 对 数据 仓库 内 部 数据 流动 和 业务 规则 的 插 述 。 元 数据 的 框架 图 如 图 8-1 所 示 。 


























S 
即席 查询 、 报 表 和 数据 展示 


EE —" 


数据 仓库 | 


业务 系统 和 外 部 数据 源 
图 8-1 元 数据 的 框架 图 


MERRIA! 
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8. 元 效 据 的 重要 性 





元 数据 在 商业 智能 项 目 中 占有 非常 乍 要 的 地 位 ， 它 是 数据 仓库 系统 的 灵魂 和 核心 。 数 据 
仓库 系统 在 建设 的 过 程 中 产生 的 数据 源 定 义 、 转 换 规则 的 定义 、 目 标 库 的 定义 都 存储 在 元 数 





据 库 中 。 元 数据 还 文 持 以 下 几 种 功能 : 
1) 摘 述 数据 仓库 系统 存在 哪些 数据 。 
2) 摘 述 哪些 数据 是 在 数据 仓库 系统 中 产生 的 。 
3) 摘 述 哪些 数据 将 要 抽取 到 数据 仓库 系统 中 。 
4) 评 们 数据 质量 的 好 坏 。 


5) 记录 数据 抽取 工作 的 执行 情况 。 元 数据 为 企业 建设 数据 仓库 系统 提供 了 详细 的 记录 ， 
并 且 保 证 了 数据 的 一 致 性 和 准确 性 。 因 此 元 数据 对 数据 仓库 系统 的 开发 和 管理 是 非常 重要 的 ， 


技术 元 数据 


。 存 储 数据 仓库 系 





具有 决定 性 的 意义 。 
8.9 ”元 数据 的 类 型 
元 数据 主要 包括 技术 元 数据 和 业务 元 数据 ， 如 


图 8-2 所 示 。 
技术 元 数据 CTechnical Metadata) 主要 存储 数 





统 技术 细节 方面 
的 数据 


。 存 储 数 据 仓 库 开 


发 和 管理 使 用 的 


数据 
。 存 储 ETL 数据 抽 
取 的 映射 关系 和 








业务 元 数据 


。 存储 数据 的 来 源 
。 存储 数据 的 访问 


原则 


e 存储 系统 提供 的 


决策 分 析 方 法 


。 存储 报表 展示 的 


信息 


据 仓 库 系统 技术 细节 方面 的 数据 。 主 要 包括 : 数据 转换 规则 





仓库 开发 和 管理 使 用 的 数据 ，ETL 数据 抽取 的 映射 | “在 全 数据 仓库 
关系 和 转换 规则 ， 对 数据 仓库 模式 的 定义 ， 计 算 的 | "存储 计算 的 方法 
方法 等 内 容 。 
业务 元 数据 (Business Metadata). 从 业务 角度 描 图 8-2 元 数据 的 类 型 
述 了 商业 智能 系统 中 的 数据 。 业 务 元 数据 包括 : 数据 的 来 源 ， 数 据 的 访问 原则 ， 系 统 提 供 的 
决策 分 析 方 法 ， 报 表 展 示 的 信息 等 内 容 。 业 务 人 员 可 以 通过 业务 元 数据 了 解数 据 仓 库 内 部 的 


L3. 
e. 











8.44 ”元 数据 的 作用 


元 数据 的 作用 如 图 8-3 Dro 

(OD 帮助 用 户 理 解数 据 仓库 系统 中 的 数据 

在 使 用 数据 仓库 时 ， 元 数据 可 以 帮助 用 户 理 解数 据 仓 库 中 包含 的 所 有 内 容 。 例 如 ， 用 户 
在 进行 数据 分 析 时 ， 需 要 查看 元 数据 的 内 容 ， 因 为 元 数据 包含 了 从 数据 源 到 数据 仓库 中 的 映 
射 和 关系， 数据 从 源 到 目标 的 过 程 中 ， 经 历 了 清洗 、 转 换 、 汇 上 总、 计算、 过 滤 等 变化 ， 元 数据 
能 及 时 地 跟踪 这 些 数据 变化 ， 包 括 数据 结构 发 生 的 变化 ， 而 用 户 利用 元 数据 去 理解 数据 仓库 
系统 中 发 生变 化 的 这 些 数据 ， 这 是 元 数据 的 一 个 重要 功能 。 一 般 情 况 下 ， 普 通用 户 不 熟悉 数 
据 仓库 的 技术 ， 而 元 数据 可 以 帮助 这 些 用 户 理解 数据 仓库 中 的 数据 含义 和 如 何 使 用 这 些 数据 ， 
它 是 用 户 和 数据 仓库 之 间 沟 通 的 桥梁 。 
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用 于 数据 
仓库 系统 
的 集成 


提高 数据 
仓库 系统 
的 灵活 性 










元 数据 
的 作用 










保证 数据 
的 质量 






图 8-3 ”元 数据 的 作用 


(0 用 于 数据 仓库 系统 的 集成 

数据 仓库 是 面 丫 主题 的 、 集 成 的 。 在 数据 仓库 的 实施 过 程 中 ， 通 过 元 数据 的 省 理 ， 按 照 
统一 的 数据 模型 ， 将 数据 集成 到 数据 仓库 中 ， 同 时 将 数据 源 与 数据 仓库 的 映射 关系 和 转换 规 
则 存储 在 元 数据 库 中 ， 这 也 是 元 数据 的 重要 功能 之 一 。 

(3) 你 证 数据 的 质量 

元 数据 管理 可 以 使 数据 仓库 设计 人 员 和 开发 人 员 对 数据 流程 和 转换 规则 的 定义 有 一 个 清 
晰 的 认识 ， 方 便 对 数据 质量 的 控制 ， 也 能 迅速 发 现 哪 些 地 方 存在 问题 。 相 对 于 最 终 用 户 来 说 ， 
元 数据 也 会 帮助 他 们 对 数据 的 整体 流程 ， 包 括 数 据 抽取 、 消 洗 、 转 换 、 加 载 的 规则 有 一 个 大 
概 的 认识 ， 可 以 对 数据 质量 有 一 个 正确 的 评 信 。 

(4) 所 高 数据 仓库 系统 的 灵活 性 

在 数据 仓库 系统 中 ， 元 数据 定义 了 物理 表 的 结构 、 列 属性 、 业 务 规则 ， 包 括 数据 抽取 的 
规则 、 决 集 分 析 每 内 容 ， 在 整个 商业 智能 项 目 开发 过 程 中 占有 重要 的 地 位 。 

虹 腹 企业 的 发 展 变 化 ， 利 用 元 数据 可 以 将 整体 的 工作 流 、 数 据 流 管理 起 来 ， 适 应 企业 需 
求 的 变化 和 扩展 ， 有 效 提 高 了 数据 仓库 系统 的 扩展 性 和 灵活 性 。 
































8.0 LZ BUE 


元 数据 的 管理 包含 以 下 儿 个 方面 的 内 容 : 

1) 确定 每 个 实体 的 属性 和 实体 与 实体 之 间 的 天 系 ， 退 踊 实 体 发 生变 化 时 对 全 局 造成 的 
影响 。 

2) 通过 元 数据 的 管理 机 制 ， 有 效 管理 数据 仓库 系统 的 整体 流程 ， 近 高 系统 的 扩展 性 和 项 
目 管 理 的 效率 ， 降 低 项 目 失败 的 风险 。 

3) 通过 元 数据 的 管理 ， 决 定 系 统 中 的 哪些 数据 需要 更 新 ， 以 及 更 新 的 方式 。 
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8.0 ”元 效 据 包含 的 内 容 
元 数据 主要 包含 以 下 几 个 方面 的 内 容 : 对 数据 库 方面 的 描述 ， 对 实体 的 属性 和 实体 之 间 


天 系 的 描述 ， 对 数据 库 中 各 种 物理 表 、 表 之 间 的 关系 和 属性 的 描述 ， 数 据 流 动 的 摘 述 ， 各 种 
维度 的 摘 述 等 。 元 数据 包含 的 主要 内 容 如 图 8-4 Bran 


m 对 数据 库 方面 的 描述 ， 包 括 各 种 对 象 和 对 象 属性 的 定义 NN 
" 对 实体 的 属性 和 实体 之 间 的 关系 进行 描述 HE 


n 对 数据 库 中 各 种 物理 表 、 表 之 间 的 关系 和 属性 进行 描述 E 
É 对 各 种 维度 、 层 次 、 度 量 值 进行 摘 述 NE 
m 对 ETL 过 程 中 产生 的 映射 关系 、 转 换 规则 、 数 据 的 流动 进行 描述 E 





图 8-4 元 数据 包含 的 主要 内 容 





8.1 xn 


1) 在 商业 智能 领域 中 ， 元 数据 被 定义 为 : 在 数据 仓库 系统 的 建立 、 维 护 、 管 理 和 使 用 过 
程 中 ， 用 以 描述 实际 数据 的 信息 ， 它 是 关于 数据 的 数据 。 

2) 元 数据 在 商业 智能 项 目 中 占有 非常 重要 的 地 位 ， 它 是 数据 仓库 系统 的 灵魂 和 核心 。 

3) 元 数据 主要 包括 技术 元 数据 和 业务 元 数据 。 

4) 元 数据 的 作用 包括 : 帮助 用 户 理 解数 据 仓 库 系统 中 的 数据 , 用 于 数据 仓库 系统 的 集成 ， 
你 证 数据 的 质量 ， 提 高 数据 仓库 系统 的 灵活 性 。 
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项 上 日 局 


ss 9 5 REREN H KIJE 


本 章 目标 
从 本 章 开 始 进 入 到 项 目 篇 ， 我 们 以 实际 项 目 为 基础 ， 依 托 商 业 智 能 理论 知识 ， 详 细 介 
绍 商 业 智能 项 目的 实施 过 程 ， 包 括 项 目的 局 动 、 需 求 的 定义 、 系 统 的 设计 、 系 统 的 开发 和 测 
试 、 系 统 上 线 到 验收 等 内 容 。 本 章 重 氮 介 绍 项 目的 局 动 过 程 和 需求 的 定义 。 
学 习 本 章 后， 您 将 掌握 : 
e 商业 智能 项 目的 局 动 步 又 。 
商业 智能 项 目的 需求 定义 过 程 。 
需求 调研 的 方式 。 
如 何 制订 商业 智能 项 目的 调研 计划 。 
系统 原型 的 建立 条 件 。 
验收 和 评审 包含 的 内 容 。 


9.1. 商业 智能 项 目的 局 动 














通常 ， 商 业 智 能 项 目的 启动 过 程 包括 项 目 资源 的 组 织 和 管理 ， 了 人 解 项 目 背 景 ， 确 定 项 目 
成 员 的 工作 范围 ， 制 订 项 目 计 划 和 实施 步骤 ， 确 定 项 目 管理 的 规范 和 流程 ， 确 定 项 目的 质量 
规范 和 要 求 ， 召 开 项 目 启动 会 ， 确 定 项 目 需 要 交付 的 成 果 ， 确 定 项 目 成 员 的 角色 及 其 主要 工 
作 内 容 等 ， 如 图 9-1 所 示 。 

下 面 介绍 商业 智能 项 目 启动 过 程 的 主要 步 又 。 

(OD 项 目 资源 的 组 织 和 管理 

商业 智能 项 目的 管理 者 通常 需要 了 解 项 目的 资源 如 何 组 织 和 管理 。 如 图 9-2 所 示 ， 项 目 
资源 的 组 织 和 管理 包括 项 目 需 要 的 运行 环境 和 开发 环境 ， 所 需要 的 软 便 件 设备 和 其 他 配套 设 
施 等 内 容 。 其 根本 目的 是 在 项 目 实施 中 根据 项 目 需 要 的 人 力 和 设备 资源 结合 项 目的 进度 、 计 
划 和 工作 安排 ， 由 项 目 经 理 或 者 项 目 管 理 者 列 出 详细 的 项 目 计划 资源 使 用 图 〈 见 图 9-3 )。 

(20 UH BITS X 

首先 需要 介绍 甲 方 公司 的 社会 背景 、 主 营业 务 及 其 公司 软 硬 件 实力 等 信息 ， 然 后 介绍 本 
次 项 目 需 要 完成 哪些 功能 模块 ， 参 考 了 哪些 成 果 ， 采 纳 了 哪些 意见 ， 借 鉴 了 哪些 行业 的 经 验 


^ x 
等 信息 。 
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图 9-1 商业 知 能 项 目的 局 动 过 程 


系统 的 开发 环境 系统 的 运行 环境 


e Windows XP/Windows 2003 — e Windows XP/Windows 2003 


项 目的 工具 列表 


。 数据 采集 工具 ;Informatica 8.1 
。 数据 分 析 工 具 : Cognos 8.3 








图 9-2 资源 的 组 织 和 管理 


进度 时 间 
图 9-3 项 目 计 划 的 资源 使 用 图 
(3) 确定 项 目 成 员 的 工作 范围 


完成 商业 智能 项 目 主要 包括 需求 分 机 、 数 据 模 型 的 设计 、 数 据 模 型 的 物理 实现 、ETL UE 
计 和 实现 、 数 据 分 析 和 报表 展示 功能 的 设计 和 实现 ， 由 此 划分 项 目 组 成 员 的 工作 范围 。 
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(4) TELE TITIRA 
一 般 来 说 ， 商 业 智 能 项 目 需要 交付 的 成 末 包 括 商 业 智能 软件 系统 、 技 术 开 发 文档 、 测 试 
说 明文 档 、 商 业 智 能 项 目 管理 文档 ， 如 图 9-4 Pros. 





商业 智能 
软件 系统 















JL A Bb 


商业 智能 
项 目 交 付 
成 东 


El HE 





测试 说 明 
文档 





图 9-4 商业 智能 项 目 需要 交付 的 成 采 


其 中 ， 拉 术 开 发 文档 包括 系统 实施 方案 、 和 需求 说 明 书 、 系 统 概要 设计 说 明 书 、 系 统 详细 
设计 说 明 书 、 数 据 库 设计 说 明 书 、 用 户 手 册 、 维 护 手册 等 文档 ; 测试 说 明文 档 包 括 测 试用 例 
及 其 测试 说 明报 告 等 文档 ， 商 业 智 能 项 目 管理 文档 包括 项 目 开 发 的 进度 报告 和 项 目 开 发 计划 
书 ， 以 及 项 目的 验收 报告 。 

(5) 项 目 组 的 成 员 角 色 及 主要 工作 内 容 

商业 智能 项 目 一 般 包 括 以 下 成 员 及 其 角色 ， 如 图 9-5 所 示 。 


业务 组 成 员 开发 组 成 员 


e TELA 。 总 体 协 调 

。 业务 负 贡 人 。 总 体 技术 负 责 

。 技 术 负 责 人 。 总 体 业务 指导 
。 项 目 实施 经 理 
。 技术 开发 经 理 














。 平台 开发 经 理 

e 客户 经 理 

° ETL 开发 工程 师 

。 展 示 平 台 开 发 工程 师 
。 美工 

。 系统 维护 工程 师 





图 9-5 项 目 组 的 成 员 及 其 角色 


D 业务 组 成 员 : 包括 项 目 负 责 人 、 业 务 负 责 人 、 技 术 负 责 人 。 

2) 开发 组 成 员 : 包括 总 体 协 调 、 总 体 技术 负责 、 总 体 业 务 指 导 、 项 目 实施 经 理 、 技 术 开 
发 经 理 、 平 台 开 发 经 理 、 客 户 经 理 、ETL 开发 工程 师 、 展 示 平 台 开 发 工程 师 、 美 工 、 系 统 维 
护 工 程 师 。 

e 总 体 协调 主要 负责 审批 商业 智能 项 目 方案 和 计划 的 可 行 度 , 调配 项 目 成 员 , 提供 人 力 、 
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财力 和 一 些 必要 的 配套 设施 。 








总 体 技术 负责 主要 是 针对 商业 稼 能 项 目 制订 项 目 方 条 、 计 划 ; 负责 项 目 实施 工作 ， 协 





调和 管理 项 目 成 员 ， 包 插 与 业务 人 员 的 工作 协调 和 沟通 ， 负 责 商业 智能 技术 塔 训 和 业 


务 分 机 、 系 统 整体 的 设计 。 








调 ， 把 握 整 体 业 务 的 流程 。 











功能 设计 、 数 据 库 管理 功能 开发 等 工作 。 
平台 开 友 经 理 主要 负 贡 平台 负面 的 展示 功能 。 





























客户 经 理 主要 负责 商业 智能 项 目 中 与 客户 的 沟通 。 
ETL 开发 工程 师 主要 负责 商业 智能 项 目 数 据 库 、 文 件数 据 抽 取 的 设计 与 开发 。 














示 功 能 。 
美工 主要 负 贡 整体 系统 页面 的 设计 和 规划 。 
系统 维护 工程 师 主 要 负责 系统 的 运行 和 维护 。 





9.2 商业 智能 项 目的 需 来 定义 











总 体 业 务 指导 主要 是 针对 业务 的 总 体 指导 ， 负 责 相 关 业 务 人 员 和 技术 人 员 的 沟通 协 


项 目 实施 经 理 主要 是 负责 需求 调研 、 分 析 开 发 、 实 施 , 包括 以 后 的 测试 、 维 护 每 工作 。 
技术 开发 经 理 主 要 负 贡 需求 分 析 、 概 要 设计 、 主 细 设 计 、 数 据 库 设 计 、 数 据 库 建 模 、 





展示 平台 开发 工程 师 主 要 负责 商业 智能 项 目 展示 平台 的 研发 ， 包括 开发 报表 的 展 


需求 分 析 是 商业 智能 项 目的 第 一 步 ， 通 常 包括 需求 采集 和 需求 分 析 。 需 求 采集 是 针对 用 
户 所 能 提供 的 大 方向 以 及 部 分 需求 ， 去 预见 以 后 的 需求 ， 需 求 分 析 是 在 需求 采集 过 程 中 ， 根 
据 调研 大 纲 ， 充 分 了 解 企业 不 同 层次 人 员 的 需求 ， 并 且 对 需求 进行 仔细 的 分 析 、 总 结 、 归 纳 、 
整理 ， 形 成 一 份 准确 的 需求 分 析 报告 。 同 时 为 了 减少 用 户 需求 的 变更 ， 能 够 了 解 用 户 的 真实 

















需求 ， 可 以 采用 多 种 方式 进行 调研 ， 例 如 通过 问卷 或 者 会 议 的 形式 进行 记录 。 需 求 分 析 也 是 
到 明确 而 详细 的 需求 。 


一 个 经 过 不 断 循 环 、 反 饿 和 不 断 完 善 的 过 程 ， 只 有 这 样 才 


下 面 是 对 需求 各 阶段 的 详细 介绍 。 
1. 需求 调研 问卷 设计 
需求 调研 问卷 是 根据 问卷 中 的 问题 和 最 终 用 户 的 
问答， 提取 相应 的 内 容 ， 并 且 进 行 详细 的 统计 分 析 和 
整理 ， 形 成 比较 完整 的 需求 信息 资料 ， 从 而 得 到 用 户 
最 真实 的 需求 。 调 研 问卷 设计 应 遵循 问卷 的 合理 性 、 
全 面 性 、 简 单 性 、 易 扩充 性 等 原则 《〈 见 图 9-6)， 以 便 
在 调研 时 整理 与 分 析 。 
e 合理 性 是 指 问卷 的 设计 需要 与 相关 业务 保持 
一 致 性 。 
e 人 简单 性 是 指 在 问卷 过 程 中 尽 可 能 地 减少 业务 
人 员 的 工作 量 , 通过 最 简单 的 形式 获得 业务 人 
员 更 深层 次 的 需求 。 
e 另 扩 充 性 是 指 提供 灵活 的 处 理 手 段 ,使 调研 对 
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25 ^H 


图 9-6 








调研 问卷 设计 的 原则 


象 可 以 比较 清楚 地 回答 调研 问题 。 
e 全 耐性 是 指 调研 问题 设计 应 该 全 面 缆 闸 所 有 的 相关 业务 ， 使 需求 调研 人 员 能 够 清楚 地 
获取 需要 的 调研 结果 ， 使 问卷 成 为 一 个 相对 完整 的 整体 。 
2. 需求 调研 问卷 内 容 
针对 商业 智能 项 目的 调研 主要 包括 以 下 几 个 方面 : 
10 目前 业务 系统 的 现状 熟悉 业务 系统 的 编码 标准 和 当前 系统 的 应 用 现状 。 
2) 业务 数据 库 的 基本 信息 : 搜集 数据 库 系统 的 版 本 、 操 作 系 统 的 版 本 、 当 前 的 数据 量 和 
数据 的 保存 方式 。 
3) 数据 字典 的 信息 : 搜集 业务 数据 库 中 数据 结构 的 信息 。 例 如 ， 表 、 视 图 的 结构 说 明 ， 
所 有 列 、 主 键 、 外 键 、 索 引 的 基本 信息 ， 这 些 信 息 保证 了 数据 抽取 的 设计 和 开发 。 
4) 测试 数据 的 搜集 : 为 了 保证 测试 的 准确 性 ， 搜 集 当 前 系统 的 真实 数据 供 系 统 开 发 环 
境 和 测试 环境 使 用 ， 并 且 遵 循 以 下 原则 : 编码 表 的 数据 不 能 缺失 ; 事实 表 的 数据 字段 不 能 缺 
R, 并且 保证 编码 字段 不 能 被 修改 。 一 般 来 说 ,测试 数据 是 真实 数据 的 一 半 左 右 ， 同时 各 个 
业务 系统 的 数据 时 间 段 尽量 保持 统一 ， 例 如 搜集 菜 生产 系统 的 数据 时 间 段 是 2008 年 1 月 到 
2011 年 1 月 ， 而 搜集 某 营销 系统 的 数据 时 间 段 仍然 是 2008 年 1 月 到 2011 年 1 月 ， 这 样 会 
保证 开发 和 测试 的 准确 性 ， 同 时 搜集 的 历史 数据 应 该 至 少 2 一 3 年 。 测 试 数据 的 搜集 原则 如 
图 9-7 所 示 。 



















































编码 表 的 数 
据 不 能 缺失 










事实 表 的 数 










历史 数据 应 该 测试 数据 的 据 字段 不 能 
至 少 2~3 年 搜集 原则 缺失 ， 编 码 






字段 不 能 被 
修改 










各 个 业务 系 
统 的 数据 时 
间 段 尽量 保 
Po~ 








图 9-7 测试 数据 的 搜集 原则 


5) ETL 需求 调研 : 主要 以 问卷 的 形式 对 数据 抽取 、 转 换 、 加 载 的 需求 进行 调研 。 问 卷 的 
内 容 通常 包括 指标 项 、 数 据 获 取 的 频率 、 数 据 获 取 的 方式 ， 以 及 备注 等 内 容 。 例 如 ， 以 问卷 
的 形式 对 客户 进行 调研 ， 获 取 工 业 耗 电量 、 民 用 耗 电量 、 其 他 类 型 的 耗 电量 3 个 指标 数据 的 
获取 频率 〈 年 、 季 、 月 、 日 、 小 时 )、 获 取 方 式 〈 数 据 库 直接 读 取 、 文 本 文件 或 其 他 方式 ) 等 
信息 ， 见 表 9-1。 


























85 


表 9-1 某 系 统 ETL 需求 调研 示例 


指 标 项 数据 获取 频率 数据 获取 方式 备 d 














工业 耗 电量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 
民用 耗 电量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 
其 他 类 型 的 耗 电量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 


6) 主题 分 析 需 求 调 研 : 主题 分 析 需 求 调 研 的 示例 如 网 9-8 所 示 。 由 该 图 可 看 出 ， 人 员 
基本 信息 主题 域 包括 人 员 家 性 成 员 人 信息、 人 员 职 位 信息 、 人 员工 作 经 历 信 息 、 人 员 社 会 关系 
信息 、 人 员 教育 背景 信息 、 人 员 通 信 地 址 信息 、 人 员 社 会 保险 信息 等 内 容 。 我 们 以 问卷 调研 
的 形式 得 到 哪些 层次 的 客户 人 员 天 心 该 主题 域 , 如 何 获 得 该 主题 域 的 数据 、 该 主题 域 中 数据 
的 频率 是 多 少 、 关 注 该 主题 域 的 企业 对 象 有 哪些 、 针 对 该 主题 域 的 维度 分 析 有 哪些 等 内 容 。 


























图 9-8 人 员 基 本 信息 主题 域 








以 下 是 天 于 人 员 基 本 信息 主题 域 的 问 大 示例 。 

1) 您 是 否 关 心 该 主题 域 ? 

Oz; 

Oie 

2) 获得 该 主题 域 数据 的 情况 : 

口 能 够 从 业务 系统 中 获得 该 主题 的 所 有 数据 ; 

口 可 获得 业务 系统 中 的 部 分 数据 , 请 详细 说 明 可 以 获得 哪些 数据 : ; 
口 从 业务 系统 中 不 能 获得 任何 数据 ; 

口 其 他 情况 ， 请 评 细 说 明 : 
3) 获得 该 主题 域 中 数据 的 频 京 是 多 少 ? 

OF; 

口 季 ; 

Ei 

OH; 

口 小 时 ; 
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L1) 915 

口 实时 。 

4) 关注 访 主题 域 的 企业 对 和 象 : 
口 公司 领导 决 朱 人 员 ; 





口 公司 中 层 管 理 人 员 ; 
口 公司 业务 人 员 :; 


口 其 他 人 员 ， 请 详细 说 明 : 

5) 针对 该 主题 域 的 维度 分 析 : 

口 按时 间 维 虔 ; 

口 按 地 区 维度 ; 

口 其 他 ， 请 详细 说 明 : 

3. 制订 商业 智能 项 目的 调研 计划 

制订 调研 计划 主要 包括 : 完成 整个 调研 过 程 中 的 工作 任务 分 配 ， 工 作 时 间 的 安排 ， 资 源 
的 调度 ， 以 及 调研 的 目标 等 内 容 。 在 进行 需求 分 析 之 前， 需要 制订 详细 完备 的 调研 计划 ， 目 
的 是 安排 好 调研 的 侧重 点 ， 以 及 其 详细 的 调研 步骤 。 在 制订 调研 计划 的 时 候 ， 同 样 需 要 说 明 
调研 的 背景 、 调 研 的 目标 、 调 研 的 范围 以 及 各 种 调研 的 方式 等 内 容 ， 这 样 有 利于 调研 人 员 有 
的 放 和 天 ， 对 调研 工作 做 好 充分 的 准备 。 调 研 计 划 可 以 分 成 以 下 几 个 步骤 : 

C12 确定 调研 目标 

确定 调研 目标 可 以 有 多 种 方式 。 例 如 ， 通 过 填写 调研 调查 表 或 者 会 议 座 谈 的 形式 对 业务 
需求 进行 调研 、 整 理 和 记录 ; 同时 让 企业 领导 、 中 层 管理 人 员 、 业 务 人 员 、 商 业 智 能 项 目 组 
的 开发 设计 人 员 在 此 期 间 达 成 共识 。 在 对 应 用 系统 进行 调研 时 ， 需 要 全 面 了 解 当 前 系统 的 各 
种 信息 资源 ， 包 括 数据 的 来 源 、 数 据 生成 的 时 间 和 频率 等 信息 。 同 样 ， 可 以 将 其 他 行业 成 功 
的 案例 作为 学 习 的 模板 。 

(2) 人 确定 人 员 组 织 结 构 

确定 项 目的 人 员 组 织 结构 是 为 了 保证 甲 方 和 乙方 人 员 之 间 的 配合 。 例 如 ， 在 商业 智能 项 
目 实施 初期 ， 乙 方 需要 项 目 经 理 制 订 项 目 工作 的 计划 ， 制 订 资 源 使 用 计划 ， 协 调 各 部 门 乙 间 
的 配合 ， 把 握 项 目的 进度 ， 甲 方 业 务 顾问 需要 为 乙方 人 员 提 供 业 务 方面 的 指导 ， 需 求 分 机 人 
员 和 需要 对 项 目 和 需求 进行 采集 和 调研 ， 系 统 染 构 人 员 对 项 目 整 体 架 构 进行 分 析 和 规划 ， 开 发 人 
员 主 要 负 员 商业 智能 系统 的 设计 与 实现 。 

4. 调研 方式 

(1) 会 议 或 访谈 的 形式 

在 开始 访谈 之 前 ， 应 该 预定 好 访问 的 时 间 和 地 点 ， 确 定 参 会 人 员 及 其 各 方 主 要 负责 人 ， 
包括 双方 需要 做 哪些 准备 工作 等 内 容 。 在 访谈 的 时 候 ， 需 要 与 相关 业务 人 员 进 行 交 流 ， 乙 方 
需要 根据 调研 大 纲 的 内 容 进行 有 的 放 和 天 的 提问 ， 无 论 是 甲 方 人 员 还 是 乙方 人 员 ， 都 需要 进行 
详细 的 记录 和 分 析 。 调 研 的 内 容 可 以 包括 当前 应 用 系统 的 实际 现状 和 数据 资源 的 配置 情况 。 
在 访谈 结束 时 ， 应 该 形成 统一 风格 的 文 当 ， 以 备 后 来 的 需求 分 析 使 用 。 

(2) 问卷 调查 的 形式 

如 采 采 用 问卷 调 得 的 形式 ， 应 该 尽量 对 提出 的 问题 进行 认真 的 设计 和 规划 ， 从 而 保证 
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的 质量 和 效果 ， 使 业务 人 员 能 够 对 问卷 中 提出 的 问题 有 针对 性 地 进行 回答 。 
5. 调研 的 内 容 和 形式 
在 需求 调研 过 程 中 ， 需 要 了 解 企业 不 同 层 次 人 员 的 业务 需求 ， 包 括 企业 的 领导 决策 层 、 














管理 层 、 各 个 业务 部 门 的 相关 人 员 和 技术 人 员 ， 如 图 9-9 所 示 。 针 对 不 同 的 调研 对 象 ， 


的 侧重 点 也 有 所 不 同 。 


针对 领导 





图 9-9 调研 的 内 容 和 形式 


(1) 针对 领导 决策 层 

e 需要 了 解 领导 决策 层 关 注 哪些 主题 和 哪些 重点 指标 。 

e 在 当 表 业务 系统 中 ， 领 导 决 琳 层 以 何 种 方式 获取 这 些 指标 。 

e 领导 决策 层 铝 户 这 些 重 点 指标 的 展现 方式 是 什么 ， 以 及 目前 指标 的 展现 方式 是 什么 。 

e 领导 决策 层 铝 户 这 些 重点 指标 关联 哪些 维度 进行 多 维 展示 。 

e 领导 决策 层 铝 户 获 得 数据 仓库 系统 中 的 哪些 决策 分 析 功 能 。 

e 领导 决策 层 希 望 这 些 重点 指标 对 象 的 最 小 粒度 是 多 少 。 

(2) 针对 中 间 管 理 层 

e 需要 了 解 中 间 管 理 人 员 关 心 哪些 指标 和 主题 。 

e 需要 了 解 中 间 管 理 层 人 员 目 前 以 何 种 方式 获取 这 些 指标 值 。 

e 和 震 要 了 解 中 间 管 理 层 人 员 和 希望 得 到 这 些 指标 的 展现 方式 是 什么 ， 以 及 目前 指标 的 展现 
stus 

e 中 间 管 理 屋 人 员 对 商业 智能 决策 分 析 系 统 的 期 户 是 什么 。 

e 中 间 管 理 层 人 员 希 望 关 注 的 这 些 指标 关联 哪些 维度 进行 多 维 展 示 。 

e 中 间 管 理 层 人 员 和 硕 望 关注 的 这 些 指标 的 最 小 粒度 是 多 少 。 

(3) 针对 业务 人 员 

e 需要 了 解 业 务 人 员 平 时 最 常用 的 指标 是 哪些 。 

业务 人 员 最 关心 的 主题 是 哪些 。 

业务 人 员 和 希望 得 到 数据 仓库 系统 的 哪些 决策 分 析 功 能 。 

业务 人 员 和 希望 关心 的 这 些 指标 关联 哪些 维度 进行 多 维 展示 。 

业务 人 员 和 希望 关注 的 这 些 指标 的 最 小 粒度 是 多 少 。 













































































(A) 针对 技术 人 员 

e 技术 人 员 平 时 最 第 用 的 指标 是 哪些 。 

e 技术 人 员 最 关心 的 主题 是 哪些 。 

e 了 了解 目前 业务 系统 的 数据 结构 。 

e 了 解 当 前 系统 的 数据 刷新 矣 率 是 多 少 。 

e 了 了 解 当 前 系统 的 数据 源 来 自 于 哪些 业务 系统 。 

6. 商业 智能 项 目 需求 的 总 结 与 整理 

对 需求 的 总 络 与 整理 是 指 根据 调研 得 到 的 信息 进行 分 机、 上 归纳、 整理 ， 得 出 商业 智能 项 
目的 相关 需求 。 需 求 中 包括 对 现 有 应 用 系统 、 各 种 信息 资源 和 决策 分 析 系 统 之 间 关 系 的 详细 
描述 和 总 结 。 

7. 需求 说 明 书 的 编写 

需求 分 析 说 明 书 中 包括 对 本 次 商业 智能 项 目的 调研 计划 、 调 研 上 和 目标、 调研 范围 和 调研 的 
方法 、 内 容 等 信息 的 详细 描述 。 同 时 描述 该 商业 智能 系统 生成 哪些 数据 ， 生 成 的 时 间 和 频率 
是 多 少 ， 在 需求 说 明 书 中 还 需要 列 出 不 同 需求 的 数据 来 目 于 哪些 业务 系统 。 

8. 逻辑 分 析 说 阴 书 的 编写 

逻辑 分 析 过 程 是 通过 调研 获取 的 资料 去 分 析 各 种 信息 资源 ， 包 括 定 义 分 析 的 角度 、 指 标 
以 及 这 些 指标 的 数据 来 源 等 信息 。 整 个 逻辑 分 析 过 程 由 数据 仓库 设计 开发 人 员 和 业务 人 员 一 
起 完成 。 风 辑 分 析 的 过 程 是 一 个 不 断 完 善 和 项 目 迭 代 的 过 程 。 针 对 每 一 个 主题 进行 分 析 时 ， 
都 需要 考虑 已 经 完成 的 主题 分 析 和 尚未 完成 的 主题 。 

下面 以 用 户 用 电信 费 情况 主题 为 例 ， 说 明 如 何 进 行 需 求 的 逻辑 分 析 。 为 了 实现 用 电 户 的 欠 费 
总 额 、 本 年 从 费 、 两 年 以 内 从 费 、 两 年 及 两 年 以 上 从 费 、 本 年 应 收费 用 、 本 年 累计 实 收 费用 等 指 
标 在 不 同 地 区 、 时 间 、 供 电 单 位 等 维度 的 多 角度 分 析 ， 需 要 在 茶 电 力 销售 系统 的 业务 处 理 馆 辑 上 
进行 分 析 。 风 辑 分 析 说 明 书 的 编写 包括 需求 分 析 、 数 据 源 描述 、 业 务 迪 辑 处 理 方法 等 内 容 。 

(1) KERAN 

RIR AETR H E RIR RIAA o 

(2) 本 年 欠 费 

本 年 欠 旨 是 指 用 电 户 按 术 年 上 度 汇 总 计算 得 出 的 欠 费 总 籁 。 

(3) 两 年 以 内 从 费 

在 用 电 户 欠 费 中 ， 两 年 以 内 欠 费 总 和 。 

(4) Wj4E JE PAAE DÀ ICE 

在 用 电 户 欠 费 中 ， 两 年 以 上 的 欠 费 总 和 。 

(5) 本 年 应 收费 用 


























































































































在 未 收 电 费 中 ， 本 年 的 欠 费 总 额 。 

(6) 本 年 囚 计 实 收费 用 

本 年 各 月 实 收费 用 之 和 。 

(7) 地 区 

地 区 维度 一 般 分 成 省 级 、 地 市 、 县 级 3 种 维度 。 
(8) 时 间 








大 多 数 的 电力 公司 采用 投 月 人 工 抄 表 的 方式 进行 计 费 ， 时 间 维 度 一 般 是 按 月 计算 费用 ， 
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然后 由 月 进行 季度 汇总 ， 由 季度 进行 年 度 汇总 。 

(9) 供电 单位 

供电 单位 包括 省 电力 公司 、 地 市 电力 公司 或 者 县 级 电力 公司 等 。 

总 结 : 在 对 系统 进行 需求 分 析 时 ， 需 要 考虑 各 个 业务 系统 的 数据 是 否 满足 逻辑 分 析 的 需 
要 ， 包 括 数据 产生 的 周期 和 数据 质量 等 内 容 。 

商业 智能 项 目的 需求 定义 过 程 如 图 9-10 所 示 。 
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调研 的 内 容 和 
形式 





逻辑 分 析 说 明 
书 的 编写 





图 9-10 商业 知 能 项 目的 需求 定义 过 程 


9.3. 系统 原型 的 建立 











系统 原型 是 在 需求 分 析 的 基础 上 ， 经 过 业务 人 员 和 开发 人 员 共 同 协商 建立 起 来 的 ， 为 以 
后 的 系统 开发 、 测 试 和 系统 实施 上 线 打 下 了 基础 。 使 用 系统 原型 的 条 件 如 图 9-11 所 示 。 





考虑 使 用 系统 原型 不 适合 使 用 系统 原型 
模型 的 情况 模型 的 情况 


。 需 求 定义 模糊 。 用 户 需求 已 经 明确 ， 





。 需 求 改变 的 可 能 性 并 有 相应 的 文档 支持 
不 断 增 大 。 商 业 智能 系统 划分 成 
。 项 目 开发 风险 大 ， 各 个 独立 的 模块 

费用 高 e 系统 开发 的 工作 量 大 





图 9-11 使 用 系统 原型 的 条 件 


9.4 验收 和 评审 的 内 容 








验收 包括 技术 文件 清单 、 申 请 验收 里 位 的 意见 、 审 批 的 意见 等 内 容 。 评 审 方式 主要 包括 
会 议 式 、 传 阅 式 、 批 准 式 评审 。 评 审 的 内 容 包 括 业 务 和 需求 、 功 能 需求 、 非 功能 策 求 等 。 评 审 
的 结论 有 3 种 情况 : 

1) 通过 评审 ， 可 以 进入 下 一 阶段 。 
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2) 原则 通过 ， 修 改 后 进入 下 一 阶段 。 
3) 未 通过 评审 ， 修 改 后 重新 评审 。 
在 评审 过 程 中 需要 参评 人 和 评审 组 长 。 在 评审 过 程 中 ， 需 要 确定 评审 的 方式 、 评 审 的 对 
象 ， 最 后 得 出 评审 的 结果 ， 包 括 工作 成 果 是 否 合格 、 评 审 意见 和 评审 组 长 的 签字 。 





909 本章 小 结 








1) 商业 智能 项 目的 局 动 包括 项 目 资源 的 组 织 和 管理 ， 了 解 项 目 背 景 ， 确 定 项 目 成 员 
的 工作 范围 ， 制 订 项 目的 计划 和 实施 的 步骤 ， 确 定 项 目 管理 的 规范 和 流程 ， 确 定 项 目的 质 
量规 范 和 要 求 ， 召 开 项 目 局 动 会 ， 确 定 项 目 需 要 交付 的 成 来 ,确定 项 目 成 员 角 色 及 其 主要 
工作 内 容 。 

2) 需求 分 析 是 商业 智能 项 目的 第 一 步 ， 通 闻 包 丘 需 求 的 采集 和 对 需求 的 分 析 。 

3) 需求 调研 问卷 设计 的 原则 : 合理 性 、 全 面 性 、 简 单 性 、 易 扩充 性 。 

4) 调研 方式 : 会 议 或 访谈 的 形式 、 问 卷 调 碍 的 形式 。 

5) 在 需求 调研 过 程 中 , 需要 了 解 企 业 不 同 层次 人 员 的 业务 需求 , 包括 企业 的 领导 决 集 层 、 
中 间 管 理 层 、 各 个 业务 部 门 的 相关 人 员 和 技术 人 员 。 针 对 不 同 的 调研 对 象 ， 调 研 的 侧重 点 也 
有 上 所 不 同 。 

6) 丙 业 智能 项 目的 需求 定义 包括 需求 调研 问 耸 设计 ， 需 求 调 研 问 疮 内 容 ， 制 订 商 业 智 能 
项 目的 调研 计划 ， 调 研 的 内 容 和 形式 ， 商 业 智 能 项 目 珊 求 的 总 结 与 整理 ， 需 求 说 明 书 的 编写 ， 
则 辑 分 析 说 明 书 的 编 与 。 

7) 系统 原型 的 建立 为 以 后 的 系统 开发 、 测 试 和 系统 实施 上 线 打 下 了 基础 。 

8) 验收 和 评审 的 内 容 包 括 会 议 式 、 传 阅 式 、 批 准 式 评审 。 
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第 10 对 REREN EL PSP) vr. 


本 章 目标 

与 理论 篇 中 的 数据 模型 内 容 人 不同， 本章 的 重点 是 根据 实际 项 目 介 绍 数据 模型 的 设计 怕 
则 ， 概 念 模型 的 分 析 方 法 ， 主 题 域 的 设计 ， 主 题 的 设计 ， 针 对 ODS 的 逻辑 模型 设计 、 物 理 
设计 ， 针 对 数据 仓库 的 逻辑 设计 、 物 理 设计 ， 针 对 数据 集 市 的 多 辑 设计 、 物 理 设计 等 内 容 。 

学 习 本 章 后 ， 您 将 掌握 : 

e 数据 模型 的 设计 原则 。 

e 企业 数据 模型 转换 到 数据 仓库 模型 的 一 般 步 又 。 

e 概念 模型 的 设计 方法 。 

e 远 辑 模型 的 设计 方法 。 

e 物理 模型 的 设计 方法 。 


10.1. 数据 模型 的 设计 原则 
D 数据 模型 的 设计 应 该 满足 ODS、 数 据 仓库 、 数 据 集 市 的 存储 要 求 。 


2) ODS 的 数据 模型 应 该 能 够 满足 业务 系统 的 集成 性 和 交互 性 ， 提 供 统 一 的 数据 视图 。 
3) 数据 仓库 模型 应 该 满足 企业 决策 分 析 的 需要 ， 和 存储 核心 的 历史 数据 ， 完 成 必要 的 汇 














总 计算 等 要 求 。 
4) 数据 集 市 模型 应 该 满足 业务 分 析 需 求 ， 一 般 满足 星 形 模型 或 者 雪花 形 模型 等 天 系 
模式 。 








5) 数据 模型 的 设计 一 般 刘 循 国际 通用 的 标准 。 
6) 数据 模型 的 设计 需要 保证 业务 系统 的 扩展 性 。 


10.2 企业 模型 的 意义 





10.2.1 企业 模型 的 定义 


企业 模型 是 根据 业务 系统 的 特点 ， 用 数据 建 模 的 方法 插 述 企业 的 各 种 生产 经 营 活 动 ， 是 
对 业务 系统 的 抽象 ， 是 企业 信息 化 建设 的 基础 。 


10.2.2 ”建设 企业 模型 的 意义 


企业 数据 模型 从 企业 的 角 虚 去 分 机、 构造 相 应 的 业务 数据 模型 。 建 议 企业 数据 模型 的 意 
义 如 图 10-1 所 示 。 
1) 有 利于 实现 应 用 系统 与 业务 数据 的 分 离 ， 能 够 将 部 门 级 别 的 数据 汇总 到 企业 的 全 局 
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视图 中 ， 提 高 企业 的 信息 化 建设 。 
2) 为 企业 的 数据 仓库 建设 打 好 基础 ， 提 高 企业 的 雇 介 分 析 能 
3) 有 利于 规范 各 种 业务 概念 ， 避 免 业 务 概念 的 不 一 致 ， 从 而 降低 系统 应 用 集成 的 难度 。 
4) 增强 IT 撤 术 人 员 与 业务 人 员 的 沟通 ， 提 高 沟通 的 效率 。 
5) 企业 数据 模型 是 企业 高 层 领导 、 业 务 人 员 、IT 技术 人 员 共 孚 的 信息 平 侣 ， 是 企业 信 
县 化 应 用 建设 的 基础 。 























有 利于 实现 
应 用 系统 与 
业务 数据 的 
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是 企业 高 层 
领导 、 业 务 
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为 企业 的 数 
据 仓库 建设 
打 好 基础 












建设 企业 
数据 模型 
的 意义 









规范 各 种 业 
务 概念 ， 避 
他 业务 概念 
的 不 一 至 







增强 IT 技 术 
人 员 与 业务 
人 员 的 沟通 


图 10-1 建设 企业 数据 模型 的 意义 


10.2.3 企业 数据 模型 和 其 他 模型 之 间 的 关系 

企业 数据 模型 是 构建 数据 仓库 模型 、ODS 模型 、 数 据 集 市 模型 的 基础 ， 如 图 10-2 所 
示 。 企 业 模型 的 设计 主要 与 业务 相关 ， 指 导 业 务 系统 其 他 模型 的 建设 ， 保 证 ODS 模型 、 数 
据 仓 库 模 型 和 数据 集 市 模型 与 企业 模型 的 一 致 性 。 数 据 仓库 模型 、ODS 模型 、 企 业 数 据 模型 
都 属于 关系 型 数据 模型 ， 而 数据 集 市 属于 多 维 数 据 柑 型 。 


ODS 模型 














数据 集 市 模型 


企业 数据 模型 


图 10-2 企业 数据 模型 和 其 他 模型 之 间 的 关系 





10.2.4 与 企业 数据 模型 相关 的 概念 


(1) ODS 
ODS 是 各 个 业务 系统 之 间 共 圣 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 之 
PIIRI. ODS 控 照 职能 可 以 划分 为 3 个 部 分 :数据 缓冲 区 、 统 一 信息 视图 区 和 ODS ^£ 
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理 区 ， 如 图 10-3 所 示 。 数 据 缓冲 区 为 统一 信息 视图 区 提供 临时 的 存储 区 ， 它 的 存储 方式 和 
数据 结构 通 昭 与 源 系统 相同 。 统 一 信息 视图 区 为 企业 提 供 统 一 的 数据 视图 区 ， 并 且 控 照 主 题 
进行 划分 ， 存 储 实时 的 业务 数据 ， 方 便 系统 合 询 当前 的 数据 。 其 中 ODS 管理 区 的 作用 是 对 
ODS 数据 库 进行 管理 ， 包 括 存放 ETL 的 状态 信息 和 日 志 信 息 等 内 容 。 

















图 10-3 ODS 的 划分 


(2) 数据 仓库 

数据 仓库 是 一 个 面 癌 主题 的 、 集 成 的 、 不 易 丢 失 的 ， 并 且 随 时 间 变 化 的 帮助 企业 管理 人 
员 决 全 分析 的 数据 集合 。 数 据 仓库 的 理论 知识 在 理论 篇 中 已 经 有 详细 的 介绍 ， 此 处 不 再 资 述 。 

(3) 数据 集 市 

数据 集 市 是 在 数据 仓库 的 基础 上 创建 起 来 的 ， 根 据 各 个 业务 部 门 的 不 同 需要 ， 对 数据 仓 
库 中 的 数据 进行 高 度 汇总 、 计 算 。 数 据 集 市 的 作用 是 创建 一 组 特定 的 、 针 对 茶 个 主题 域 或 者 
部 门 的 特殊 数据 集合 。 一 般 来 将， 数据 集 市 的 模型 都 采用 星 形 模式 或 雪人 花形 模式 。 


10.2.5 “企业 数据 模型 转换 到 数据 仓库 模型 的 步 又 


(1) 在 企业 模型 中 有 条 件 地 选择 数据 仓库 需要 的 数据 

首先 数据 仓库 模型 应 该 包含 数据 仓库 项 目 中 所 有 的 需要 ， 在 企业 数据 模型 转换 到 数据 仑 
库 模 型 的 过 程 中 ， 应 该 有 目的 地 选择 一 些 数据 。 可 以 将 数据 元 素 分 成 需要 的 数据 元 素 、 不 需 
要 的 数据 元 系 、 可 能 需要 的 数据 元 素 。 重点 是 如 何 选择 可 能 需要 的 数据 元 系 ， 如 来 是 事务 性 
的 数据 元 系 ， 无 论 是 否 需 要 它 ， 都 应 该 引入 ;但 是 其 他 闫 型 的 数据 元 素 ， 如 末 不 确定 ， 则 更 
倾 问 于 删除 它 。 在 图 10-4 中 ， 企 业 数 据 模 型 实体 中 包 售 职工、 学生、 用 户 、 读 程 等 实体 ， 
如 果 针 对 数据 仓库 中 的 销售 主题 域 ， 可 以 选择 用 户 实体 ， 同 时 包含 了 有 间接 关系 的 用 户 信 息 
渠道 、 用 户 类 别 实 体 。 


















































企业 数据 模型 的 实体 | ”选择 相关 的 实体 间接 相关 的 实体 


用 户 信息 渠道 


用 户 类 别 





图 10-4 有 条 件 地 选择 感 兴趣 的 实体 


(2) 为 企业 模型 的 每 个 实体 都 增加 时 间 键 
在 企业 数据 模型 中 ， 有 些 实体 可 能 会 含有 时 间 键 ， 有 些 实体 可 能 不 含有 时 间 键 ;但 是 在 
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数据 仓库 模型 中 ， 所 有 的 实体 部 应 该 包含 时 间 键 (除了 统一 编码 实体 )， 因 为 数据 仓库 存储 
的 是 核心 的 历史 数据 ， 加 入 时 间 键 是 重要 的 搜集 历史 数据 的 方法 。 加 入 时 间 键 的 原则 是 : 如 
朱 该 实体 已 经 存在 时 间 属 性 ， 分 析 该 时 间 属 性 是 合 满 














足 历史 信息 的 分 析 ， 如 果 可 以 ， 则 使 用 该 时 间 属 性 
各 果 该 实体 没有 时 间 键 ， 同 时 它 又 不 是 统一 编码 实体 | 。， i 

( 即 在 一 定时 间 内 不 会 修改 的 实体 )， 则 需要 加 入 时 间 “| uu 
键 ， 以 保证 该 实体 的 历史 信息 分 析 。 举 一 个 简单 有 趣 | cns 108 
的 例子 ， 一 个 普通 的 美国 士兵 可 能 需要 以 下 信息 : 姓 ox 装备 

名 、 编 号、 入 伍 时 间 、 装 备 、 退 伍 时 间 ， 如 图 10-5 退伍 时 间 退伍 时 间 








所 示 。 因 为 入 伍 时 间 和 退伍 时 间 一 般 是 固定 的 ， 不 能 
满足 对 该 实体 的 历史 信息 的 分 析 需 求 ， 所 以 增加 了 作 


图 10-5 ”为 企业 数据 模型 增加 时 间 键 
战 时 间 这 个 属性 ， 每 个 美国 士兵 的 作战 时 间 随 看 地 区 、 战 场 的 不 同 痢 会 发 生变 人 化， 不断 产生 





新 的 历史 数据 ， 因 此 该 属性 满足 了 企业 数据 模型 转换 到 数据 仓库 模型 的 基本 条 件 。 

(3) 确定 数据 仓库 的 粒度 

确定 数据 仓库 的 粒度 级 别 影响 了 数据 仓库 模型 的 设计 ， 因 为 它 规 定 了 数据 仓库 的 灵活 
性 ， 包 括 数据 仓库 的 开销 和 创建 数据 仓库 的 工作 量 是 多 少 。 粒 度 级 别 越 高 ， 数 据 仓库 需要 处 
理 的 数据 量 越 多 。 虽 然 这 样 增加 了 系统 的 性 能 负担 ， 但 却 提 高 了 数据 仓库 的 灵活 性 和 潜在 的 
分 析 能 力 。 如 果 粒 上 度 级 别 低 ， 则 降低 了 系统 的 性 能 负担 ， 但 却 降低 了 数据 仓库 的 灵活 性 和 分 
析 能 力 。 如 末 数 据 仓 库 需 要 局 细节 的 数据 ， 和 朋 接 把 部 分 相关 实体 全 部 抽取 到 数据 仓库 中 ;如 
末 数 据 仓 库 不 需要 忆 细 节 的 数据 ， 则 可 以 对 部 分 实体 进行 轻 度 汇 忌 或 者 过 派 。 

(4) 汇总 企业 模型 中 的 数据 

汇总 企业 模型 中 数据 的 目的 是 节省 数据 仓库 中 的 空间 ， 提 高 数据 仓库 的 性 能 。 

汇总 的 方法 有 多 种 ， 最 主要 的 有 : 对 实体 一 个 属性 上 的 数据 求 和 ， 汇 总 一 定时 间 段 内 的 
数据 ， 按 照 茶 种 分 类 进行 汇总 数据 ， 或 者 汇总 固定 时 间 间 隔 内 的 数据 的 值 。 

汇总 企业 数据 模型 举例 如 网 10-6 所 示 。 











HA 产品 类 别 ”产品 数量 


产品 类 别 ”产品 数量 

















图 10-6 汇总 企业 数据 模型 


(5) 根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 
合并 实体 是 为 了 将 两 个 或 者 多 个 实体 合并 成 一 个 实体 ， 通 过 合并 实体 可 以 减少 实体 之 
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间 的 连接 操作 ， 提 高 数据 仓库 的 性 能 。 合 并 实体 的 条 件 是 多 个 实体 乙 间 必须 要 有 共同 的 
键 ， 人 否则 不 能 合并 。 当 多 个 实体 合并 到 一 个 实体 中 时 ， 任 何 属 性 的 变化 都 会 产生 新 的 一 
行 。 合 并 实体 是 将 第 三 范式 回归 到 第 二 范式 的 过 程 。 如 图 10-7 所 示 ， 美 国 大 兵 作为 一 个 实 
体 ， 有 姓名 、 作 战 时 间 、 入 伍 时 间 、 退 伍 时 间 、 关 备 编写 、 性 别 编写 等 属性 ， 同 时 关联 两 
个 实体 编码 表 【( 浅 备 编 码 实 体 、 性 别 编码 实体 )， 为 了 提 融 数据 仓库 的 性 能 ， 增 加 数据 仓库 
的 灵活 性 ， 把 美国 大 兵 实 体 和 装备 编码 实体 、 性 别 编码 实体 进行 了 合并 ， 也 就 是 将 第 三 范 
却 回 归 到 第 二 范 却 。 


































装备 编码 


姓名 

作战 时 间 
入 伍 时 间 
退伍 时 间 


图 10-7 合并 实体 
总 结 : 企业 数据 模型 转换 到 数据 仓库 模型 的 步骤 如 图 10-8 所 示 。 


姓名 
性 别 


作战 时 间 
xd 

入 伍 时 间 
退伍 时 间 





在 企业 模型 中 选择 数据 仓库 需要 的 数据 


y 


在 企业 模型 的 各 个 实体 中 增加 时 间 键 


y 
y 
y 





汇总 企业 模型 中 的 数据 








根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 


图 10-8 企业 数据 模型 转换 到 数据 仓库 模型 的 步 缀 


10.3 ”概念 模型 的 设计 





概念 醒 型 是 最 高 层次 的 数据 模型 ， 它 定义 了 核心 的 业务 概念 及 其 关系 。 概 念 模 型 的 分 析 
通 冲 是 以 企业 模型 为 基础 的 ， 而 企业 模型 主要 描述 企业 内 部 的 组 织 结构 和 企业 经 侣 活动 状况 
等 信息 。 概 念 模型 主要 包含 主题 域 和 主题 域 下 面 的 主题 。 主 题 域 反映 了 东方 面 的 业务 活动 情 
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况 ， 并 且 按照 企业 经 营 活 动 的 规律 将 实体 和 实体 乙 间 的 关系 进行 划分 。 主 题 域 用 以 描述 企业 
核心 的 业务 数据 ， 它 独立 于 任何 业务 系统 ， 描 述 了 企业 经 营 生产 活动 中 ， 需 要 管理 的 主题 的 
集合 。 主 题 域 可 以 进一步 划分 成 各 个 主题 ， 概 念 模型 的 主题 是 通过 分 析 企 业 包 含 的 经 营 活 
动 、 业 务 流程 、 业 务 之 间 的 关联 关系 和 所 涉及 的 数据 概念 得 出 的 。 主 题 也 可 以 进一步 细 化 成 
更 小 的 主题 ， 实 体 是 概念 模型 建设 中 最 小 的 蛙 元 ， 是 不 可 划分 的 。 概 念 模型 残 是 由 主题 域 、 
主题 、 实 体 和 实体 之 间 的 关系 组 成 的 。 概 念 模型 的 组 成 如 图 10-9 所 示 。 























实体 和 实 


体 之 间 的 
关系 





图 10-9 ”概念 模型 的 组 成 


举例 如 下 : 人 员 基 本 信息 主题 域 用 于 摘 述 人 员 的 基本 信息 情况 。 人 员 基 本 信息 主题 域 包 
ee ome EA a a 























人 员 社 会 
保险 信息 





人 员 职 位 人 员 通 信 
HB. 地 址 信息 


人 员工 作 
经 历 信 息 


图 10-10 人 员 基 本 信息 主题 域 








10.4 ”逻辑 模型 的 设计 


10.4.1 ODS 逻辑 模型 


1. ODS 逻辑 模型 设计 
ODS i£ uiui ODS 统一 信息 视图 区 集成 各 类 业务 系统 的 源 数据 ， 以 数据 主题 
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域 作 为 设计 的 基础 。ODS 统一 信息 视图 区 有 选择 性 的 集成 各 类 业务 系统 的 数据 ， 通 过 ETL 
数据 抽取 、 转 换 、 加 载 与 业务 系统 进行 交互 ， 它 主要 保存 与 主题 相关 的 、 实 时 性 的 信息 ， 因 
此 ODS 统一 信息 视图 区 其 有 准 实时 性 的 特点 ; 而 业务 系统 的 数据 通过 一 定 的 时 间 间 隔 ， 最 
终 以 主题 的 形式 反映 到 ODS 统一 信息 视图 区 中 。 如 图 10-11 所 示 ， 用 户 可 以 访问 ODS 统一 
言 套 视图 区 ， 以 便 快 速 查 询 某 个 主题 的 信息 。 
































人 员 基 本 信息 主题 域 (ODS 统 一 信息 视图 区 ) 





图 10-11 业务 系统 与 ODS 统一 信息 视图 区 的 交互 


通过 业务 系统 的 不 断 完善 和 加 强 ，ODS 过 辑 模型 不 断 得 到 补充 。 企 业 从 外 部 或 者 内 部 
生产 经 营 活 动 中 获得 各 种 业务 数据 ， 按 照 业 务 功 能 分 成 几 类 主题 域 ， 由 ODS 统一 信息 视图 
区 插 述 各 个 主题 域 。 如 图 10-12 所 示 ， 美 国 国防 部 整体 可 以 划分 成 人 员 与 组 织 主题 域 、 科 拉 
研发 主题 域 、 国 防 财政 主题 域 、 反 钨 主题 域 、 安 全 主题 域 、 作 战 计划 主题 域 、 能 源 主题 域 、 
通信 主题 域 、 人 力 资源 主题 城 。 


科技 研发 国防 财政 
- TT 


能 源 通信 人 力 资 源 


图 10-12 美国 国防 部 划分 的 主题 域 









































ODS 统一 信息 视图 区 的 逻辑 模型 可 以 用 绿色 表示 中 间 库 编 公 ， 柳 色 表 示 目 己 的 私有 编 
人 码 ， 黄 色 表 示 统 一 编码 。 美 国士 兵 实 体 关 联 各 个 编码 实体 ， 包 括 装备 类 型 编码 实体 、 通 信 地 
址 编码 实体 、 军 衔 等 级 编码 实体 、 作 战地 区 编码 实体 。 其 中 装备 类 型 编码 实体 和 作战 地 区 编 
人 码 实体 作 为 逻辑 模型 中 的 中 间 库 编码 ， 通 信 地 址 编码 实体 作为 私有 编码 ， 军 衔 等 级 编码 实体 
作为 整个 主题 域 的 统一 编码 。 它 们 痢 求 属于 人 员 与 组 织 主 题 域 。 该 主题 域 下 的 各 个 编码 实体 
如 图 10-13 所 示 。 

2. ODS 逻辑 异型 的 设计 步骤 

ODS 沁 辑 模型 设计 主要 考 夸 业务 之 间 的 关系 和 业务 处 理 的 流程 。 处 理 的 步骤 如 下 : 

(1) 硝 定 业务 系统 数据 的 范围 

在 ODS 涵 辑 模型 设计 中 ， 确 定 业 务 系统 数据 范围 是 在 调研 的 基础 上 进行 的 ， 然 后 再 进 
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各 种 业务 模型 进行 合并 或 者 拆 分 ， 然 后 再 进行 抽象 ， 以 便 划 分 ODS 数据 主题 的 范围 。 





军衔 等 级 编码 作战 地 区 编码 





图 10-13 人 员 与 组 织 主 题 域 的 编码 实体 





(2) 对 主题 的 定义 

根据 调研 的 结 示 和 业务 系统 数据 的 范围 ， 对 较 大 的 数据 主题 进行 分 解 、 定 义 ， 以 便 形 成 
各 个 主题 。 

G) 确定 主题 的 元 系 

根据 每 个 主题 ， 分 别 定义 实体 、 实 体 之 则 的 关系 ， 每 个 实体 的 属性 和 存储 粒度 等 。 

(4) 合并 相同 的 实体 及 其 属性 

对 每 个 主题 中 相似 的 实体 及 其 属性 进行 合并 ， 保 证 各 实体 的 一 致 性 和 唯一 性 。 


ODS 人 逻辑 模型 的 设计 步骤 如 图 10-14 所 示 。 
© 












逻辑 模型 的 对 主题 的 
设计 步骤 定 》 





图 10-14 ODS 逻辑 模型 的 设计 步骤 


3. ODS 的 存储 周期 和 存储 粒度 

ODS 的 存储 周期 分 为 以 下 几 种 情况 : 

1) 当 临 时 数据 从 ODS 存储 区 加 载 到 数据 仓库 后 ， 需 要 删除 ODS 存储 区 中 的 临时 数据 。 

2) 对 于 细节 性 或 者 汇总 的 数据 ， 可 以 按照 实际 的 业务 需求 ， 以 年 、 季 、 月 进行 存储 ， 
并 且 删 除 过 期 数据 。 

3) ODS 存储 区 中 如 果 存 在 一 些 有 价值 的 数据 ， 但 是 使 用 频率 较 低 ， 则 需要 将 数据 备份 
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到 其 他 存储 介质 中 ， 为 以 后 使 用 作 准 备 。 








总 结 : 存储 粒度 的 划分 将 直接 影响 ODS 5 旬 辑 模型 的 设计 和 ODS 存储 区 的 数据 量 ，ODS 


的 存储 粒度 一 般 与 源 数据 保持 一 致 。 
4. ODS 逻辑 模型 实例 
如 图 10-15 所 示 ， 国 家 、 省 、 地 市 、 县 、 区 等 实体 继承 地 区 实体 。 





地 区 范围 类 型 


编码 «Undefined»? 
名 称 《Undefined》 











| 
Rel ationship_11 
/n 
LLL 
地 区 


编码 «Undefined» 
和 名称 XUndefined» 
























































X 

国家 | Inheritance 2 | 区 
编码 《Undefined> = JAW 《Undefined> 
名 称 «Undefined» Í — EI «Undefined» | 

| 

省 2 地 市 ~ 县 
编码 «Undefined» 编码 «Undefined? 编码 《Undefinedy> 
名 称 《Undefined> 名 称 《Undefined> | 和 名称 《Undefined> 

















图 10-15 ODS 逻辑 建 模 实例 
模型 描述 见 表 10-1 一 表 10-7. 


表 10-1 国家 


表 10-2 省 


表 10-3 地 市 
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Hi 


Hi 


Hi 


410-4 县 


序 号 中 文 属性 名 英文 属性 名 数据 类 型 TE 
5 


k 10-5 K 


5 


k 10-6 地 区 


序 中 文 属性 名 英文 属性 名 数据 类 型 E 


310-7 地 区 范围 类 型 


序 中 文 属性 名 英文 属性 名 数据 类 型 


10.4.2 ”数据 仓库 逻辑 模型 

1. 数据 仓库 逻辑 模型 设计 

数据 仓库 逻辑 模型 是 对 概念 模型 的 进一步 细 化 和 分 解 ， 主 要 描述 了 实体 、 属 性 以 及 实体 
之 间 的 关系 。 数 据 仓 库 罗 和 辑 模 型 设计 的 主要 工作 〈 见 几 10-16) 有 : 











Hi 








以 概念 模型 为 基础 ， 进 一 步 分 解 、 细 化 当前 的 主题 域 


定义 合适 的 数据 来 源 


确定 数据 仓库 存储 的 粒度 


确定 数据 仓库 模型 中 的 实体 、 属 性 以 及 实体 之 间 的 关系 





图 10-16 ”数据 仓库 逻辑 模型 设计 的 主要 工作 





1) 以 概念 模型 为 基础 ， 进 一 步 分 解 、 细 化 当前 的 主题 域 。 
2) 定义 合适 的 数据 来 源 。 

3) 确定 数据 仓库 存储 的 粒度 。 

4) 确定 数据 仓库 模型 中 的 实体 、 属 性 以 及 实体 之 间 的 关系 。 
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2. 确定 数据 仓库 的 存储 粒度 

数据 仓库 逻辑 设计 主要 解决 数据 仓库 的 粒度 划分 问题 。 粒 上 度 层 次 的 划分 直接 决定 了 数据 
仓库 中 的 数据 量 和 得 询 方式 。 要 选择 一 个 合适 的 粒度 级 ， 除 了 业务 上 的 需求 ， 更 需要 项 目 经 
验 的 积累 。 在 细 布 程度 很 高 的 数据 上 建立 轻 度 汇总 会 混 费 数据 库 资 源 ， 降 低 得 询 的 灵活 性 ， 
但 是 会 减少 数据 仓库 中 的 数据 量 ， 提 高 数据 仓库 运行 的 效率 。 而 如 何 确 定数 据 仓库 的 存储 粒 
上 度 ， 需 要 得 到 用 户 的 认可 。 

3. 确定 数据 仓库 的 存储 

数据 仓库 的 存储 一 般 是 稳定 的 ， 不 易 变 化 的 。 对 于 查询 频率 高 的 业务 数据 ， 需 要 将 数据 
存放 到 数据 仓库 中 ， 对 于 一 些 查 询 频 率 低 的 ， 并 且 已 经 超出 了 存储 期 限 的 业务 数据 ， 应 该 分 
离 到 外 部 存储 介质 上 ， 以 备 将 来 查询 使 用 。 

4. 数据 仓库 的 建 模 方法 

数据 仓库 一 般 的 建 模 方法 是 通过 调研 的 结果 和 业务 系统 详细 说 明文 档 ， 经 过 分 析 、 梳 理 列 
出 所 有 可 能 的 数据 主题 。 根 据 分 析 得 出 的 数据 主题 ， 结 合 相 关 业 务 的 关注 点 可 以 划分 出 各 个 主 
题 域 。 主 题 域 通常 是 联系 较为 紧密 的 数据 主题 的 集合 。 例 如 ， 从 调研 中 获悉 该 业务 包含 以 下 数 
据 主 题 ， 客 户 基 本 信息 、 客 户 信 用 信息 、 客 户 资 产 信息 、 毕 业 学 校 信息 、 出 生日 期 、 地 址 信 
息 、 岗 位 信息 、 联 系 方式 信息 、 婚 姻 状 况 信息 。 可 以 根据 业务 的 关注 点 ， 将 这 些 数据 主题 划分 
成 员工 信息 主题 域 和 客户 主题 域 。 其 中 ， 员 工 信 息 主题 域 包含 毕业 学 校 信 息 、 出 生日 期 、 地 址 
信息 、 疯 位 信息 、 联 系 方式 信息 、 婚 姻 状 况 信息 ; 客户 主题 域 包含 客户 基本 信息 、 客 户 信用 信 
寻 、 客 户 资 产 信息 。 

员工 信息 主题 域 和 客户 主题 域 如 图 10-17 所 示 。 

S. 数据 仓库 主题 域 设 计 

主题 域 设计 是 数据 仓库 逻辑 模型 建设 中 重要 的 一 步 ， 因 为 它 反映 了 企业 主要 的 业务 活动 
和 内 容 ， 根 据 企 业 活动 的 特点 和 业务 之 间 的 关联 关系 进行 主题 域 的 划分 。 主 题 域 朱 述 了 企业 
活动 的 核心 内 容 ， 如 图 10-18 所 示 ， 北 大 西洋 公约 组 织 《〈 北 约 ) 的 主题 域 设计 包含 了 北约 的 
守则 、 会 议 、 组 织 机 构 、 战 略 、 主 要 事件 等 主题 域 。 


员工 为 客户 提供 服务 
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员工 信息 主题 域 客户 主题 域 


。 毕业 学 校 信息 。 客户 基本 信息 
。 出 生日 期 。 客户 信用 信息 
。 地址 信息 o 客户 资产 信息 
。 六 位 信息 

。 联 系 方式 信息 

。 婚 姻 状 况 信 息 

















图 10-17 员工 信息 主题 域 和 客户 主题 域 图 10-18 主题 域 

6. 数据 仓库 主题 设计 

主题 设计 是 对 主题 域 进一步 分 解 、 细 化 的 过 程 。 主 题 域 下 面 可 以 有 多 个 主题 ， 主 题 还 可 
以 划分 成 更 多 的 主题 ， 而 实体 则 是 不 可 划分 的 最 小 单位 。 主 题 域 、 主 题 、 实 体 的 关系 如 
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图 10-19 所 示 。 





图 10-19 ”主题 域 、 主 题 、 实 体 的 关系 





主题 设计 的 原则 如 下 : 

1) 主题 设计 的 命名 方式 与 主题 域 的 命名 方式 你 持 一 致 。 

2) 对 主题 进行 不 断 的 细 化 、 分 解 ， 直 到 明确 模型 中 的 业务 概念 为 止 。 

3) 当主 题 细 化 、 分 解 的 工作 完成 之 后 ， 需 要 对 主题 或 者 实体 之 间 的 关系 进行 建 醒 ， 从 
而 理解 相关 的 业务 规则 。 

例如 ， 针 对 北大 西洋 公约 组 织 《〈 北 约 ) 主题 域 中 的 组 织 机 构 进 行 主题 设计 ， 如 图 10-20 
PES 














图 10-20 组织 机 构 主题 域 


7. 数据 仓库 逻辑 模型 设计 
针对 会 议 主题 域 的 逻辑 模型 设计 如 图 10-21 所 示 。 








军事 委员 会 

















Relationship 1 Relationship 13 Relationship 14 












































EN iN y 一 一 一 
国际 军事 参谋 部 战区 司令 部 | | 负责 北欧 防务 
|| 
| m 
JL. y 
RETEA. Relationship_16 











Ai 4A 
实施 军委 会 的 政策 和 计划 ] 各 战区 编码 


图 10-21 “会议 主 题 域 的 逻辑 模型 设计 
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模型 描述 如 下 : 

D 军事 委员 会 : 北约 军事 、 政 治 的 决策 机 构 ， 同 时 问 北 约 秘书 长 、 北 大 西洋 理事 会 、 
防务 计划 委员 会 等 提供 建议 ， 是 北约 的 最 高 军事 机 构 。 

2) 国际 军事 参谋 部 : 是 北约 军事 委员 会 的 执行 机 构 ， 负 责 制 订 军 事 计 划 、 提 出 有 关 军 
事 政策 的 建议 ， 负 责 执行 北约 军事 委员 会 的 各 种 决定 。 

3) 战区 司令 部 : 北约 军事 委员 会 下 辖 的 战区 司令 部 。 

4) 负责 北约 防务 : 由 北约 军事 委员 会 负责 领导 北约 防务 的 问题 。 

5) 实施 军委 会 的 政策 和 计划 : 由 国际 军事 参谋 部 负责 实施 军委 会 的 政策 和 计划 。 

6) 各 战区 编码 : 包括 目前 北约 所 有 的 战区 名 称 及 其 战区 编码 。 

逻辑 模型 中 的 实体 可 以 分 成 两 个 部 分 ， 普通 实体 和 从 其 他 主题 中 引用 的 实体 。 在 网 10-21 
中 ， 军 事 委员 会 是 从 其 他 主题 中 引进 的 ， 所 以 可 以 将 它 标 成 黄色 以 示 区 分 。 

其 他 的 实体 ， 例 如 国际 军事 参谋 部 、 战 区 司令 部 等 都 是 模型 中 普通 的 实体 ， 以 绿色 表 
示 ， 实 体 和 实体 之 间 的 关系 也 可 以 分 成 普通 的 对 应 关系 和 汇总 关系 。 

8. 数据 仓库 逻辑 模型 建设 方案 

数据 仓库 逻辑 模 型 建设 方案 如 网 10-22 所 示 。 









































































。 适合 一 般 相 对 稳定 的 查询 需求 
通过 轻 度 汇总 或 者 高 度 |。 这 种 建 模 方式 相对 容易 实现 
汇总 的 方式 架构 数据 

t PEE REUS 










。 针 对 特殊 的 、 灵 活 的 查询 需求 ， 
通过 提供 相对 细节 的 | 请 足 更 长 远 的 需求 
数据 架构 数据 。 这 种 建 模 方 式 相 对 难度 较 大 ， 开 
仓库 逻辑 模型 发 周期 较 长 ， 需 要 技术 开发 人 员 
与 设计 人 员 理 解 的 业务 规则 更 多 








图 10-22 ”数据 仓库 多 辑 模型 建设 方案 








(1) 通过 轻 度 汇总 或 者 高 度 汇总 的 方式 架构 数据 仓库 旬 辑 模型 

通过 轻 度 汇总 或 者 融 度 汇总 的 方式 架构 迪 辑 模型 ， 针 对 整个 数据 仓库 项 目 ， 标 准 化 地 管 
理 层 次 编码 ， 根 据 不 同 的 类 型 编码 例如 地 区 编码 、 人 员 类 型 编码 ) 多 角度 地 实现 数据 的 汇 
总 和 标准 化 ， 明 确 各 项 汇总 数据 在 数据 仓库 中 的 粒度 。 虽 然 这 种 建 模 方式 相对 容易 实现 ， 但 
是 存在 一 定 的 缺陷 ， 残 是 对 各 种 特殊 的 、 灵 活 多 释 的 合 询 所 需求 的 文 持 性 较 差 ， 只 适合 一 般 
相对 稀 定 的 得 询 需 求 。 

(2) 通过 提供 相对 细 市 的 数据 染 构 数据 仓库 逻辑 模型 

针对 特殊 的 、 灵 活 的 合 询 需求 ， 可 以 提供 粒度 级 别 相对 较 细 节 的 数据 作为 数据 仓库 逻辑 
建 模 的 基础 ， 这 样 可 以 满足 更 长 远 的 需求 。 但 是 这 种 建 醒 方式 相对 难度 较 大 ， 开 发 周期 较 
长 ， 和 需要 技术 开发 人 员 与 设计 人 员 理解 的 业务 规则 更 多 。 

总 结 : 在 设计 数据 仓库 逻辑 建 模 方 采 的 时 候 ， 通 第 及 用 两 种 方式 相 结 合 的 方法 。 针 对 灵 
活 多 变 的 得 询 分 析 需 求 ， 尽 量 将 数据 的 粒度 级 别 更 细 布 化 ， 对 于 相对 稳定 的 得 询 需 求 ， 更 倾 
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问 于 通过 对 数据 的 轻 度 汇总 或 者 融 度 汇总 去 染 构 数据 仓库 逻辑 模型 。 

9. 数据 仓库 逻辑 异型 实例 

图 10-23 所 示 的 数据 仓库 多 辑 模型 包含 客户 信息 实体 、 潜 在 客户 信息 实体 、 信 用 卡 客户 
peo 体 、 对 信用 卡 客户 的 评价 实体 、 信 用 卡 客 户 基本 信息 实体 、 信 用 卡 客户 基本 信息 

汇总 实体 。 其 中 信用 卡 客户 基本 信息 实体 包含 了 客户 编码 、 客 户 名 称 、 立 己 时 间 、 个 人 信息 

ae 属性 。 立 户 时 间 、 销 户 时 间 和 个 人 信息 更 改 时 间 保 证 了 该 
实体 的 历史 信息 分 析 ， 办 卡 数 量 是 该 实体 需要 分 析 的 指标 项 。 信 用 卡 客 户 评 价 类 型 实体 存储 
丁 信用 卡 铬 性 所 有 的 评价 类 型 编 公 和 名 称 。 该 模型 满足 第 三 范式 ， 信用 卡 客户 基本 信息 汇总 
实体 是 根据 信用 卡 客户 基 本 信息 实体 里 面 的 立户 时 间 、 销 尸 时 间 ， 按 照 年 月 进行 汇总 ， 计 算 
出 客户 的 数量 。 同 时 信用 卡 客户 基本 信息 实体 继承 了 客户 信息 的 基本 属性 。 
























































客户 信息 信用 卡 客户 评价 类 型 
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Inheritance 1 LI 
" — | = 对 信用 卡 客户 的 评价 
信用 卡 客户 基本 信息 汇总 | 开始 有 效 时 间 Undefined 
年 月 《Undefinedy | 终止 有 效 时 间 «Undefined» 
客户 数量 Undefined? ds 客户 评价 编码 《Undefined> 
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Relationship 1 1 Relationship 2 

















A l "is 
Fan. | 
信用 卡 客户 基本 信息 

j 客户 编码 «Undefined» 
/ 客 A E 称 Undefined) 

= H Undefined 
ES EA 个 人 信息 更 改 时 间 <Uadefinedy 
iti P! mj [8j «Undefined» 
| HFR E «Undefined» 




















图 10-23 ”数据 仓库 逻辑 模型 
模型 描述 见 表 10-8 一 表 10-13. 


表 10-8 客户 信息 


序 号 中 文 属 性 名 英文 属性 名 数据 类 型 ] iE 
| 


Hi 





序 与 中 文 属性 名 英文 属性 名 数据 类 型 ] JẸ 
| 


Hi 





105 


表 10-10 信用 卡 客户 评价 类 型 


序 号 中 文 属性 名 英文 属性 名 数据 类 型 T 
| 


表 10-11 对 信用 卡 客户 的 评价 


NE Erw x 
| : 
ET : 
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表 10-312. 信用 卡 客户 基本 信息 汇总 


序 号 中 文 属性 名 英文 属性 名 数据 类 型 TE 
| N 
CDS N 


表 10-313 ”信用卡 客户 基本 信息 


[ewm puma [ ee | s — 
N 
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Hi 











Aiii 


| rm | mm | A | RN 


10.4.3 ”数据 集 市 逻辑 模型 
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BM 确定 需要 分 
1. 数据 集 市 逻辑 模型 的 设计 析 和 装载 的 


主题 


数据 集 市 是 针对 特定 的 茶 个 主题 域 ， 或 者 
按照 部 门 进行 划分 的 数据 集合 。 这 些 数据 是 经 T 
过 ETL 工具 的 抽取 、 转 换 、 加 载 及 其 一 系列 的 






确定 数据 集 数据 集 市 逻辑 确定 数据 集 
汇总 计算 转化 而 成 的 ， 是 在 数据 仓库 的 基础 上 市 的 存储 周期 重型 设计 的 D» 市 逻辑 模型 


的 粒度 








ey 数据 集 市 在 整体 结构 上 ， 应 该 从 ME 
合 立 方 体 的 规则 和 即席 奉 询 的 要 求 。 通 过 ETL 
工具 为 数据 仓库 生成 满足 条 件 的 立方 体 数 扼 ， 
立方 体 则 是 多 维 报表 查询 和 商业 智能 展现 分 析 








析 的 指标 和 





的 数据 提供 者 。 Marr 
数据 集 市 逻辑 模型 设计 的 主要 工作 ( 见 
图 10-24) 包括 以 下 方面 。 图 10-24 ”数据 集 市 逻辑 模型 设计 的 主要 工作 
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(1) HAE a 22) PURURESRLIT] E 

需要 明确 哪些 主题 域 是 目前 决策 分 析 人 员 和 上 层 领 寻 关心 的 ， 该 主题 域 中 哪些 主题 是 商 
业 知 能 展现 的 基础 。 这 上 择 信 息 者 是 通过 调研 的 方式 得 出 的 线条 。 

(2) 确定 数据 集 市 逻辑 模型 的 粒度 

通过 需求 的 分 析 和 调研 的 结束， 确定 模型 中 所 有 实体 的 粒度 层次 。 例 如 ， 确 定 实体 属性 
中 的 时 间 是 精确 到 月 ， 还 是 日 。 

(3) 确定 数据 集 市 逻辑 模型 需要 分 析 的 指标 和 该 指标 需要 的 维度 

数据 集 市 的 每 个 主题 都 是 由 多 张 表 组 成 的 。 这 些 表 由 事实 表 和 一 组 维 表 组 成 ， 需 要 确定 
数据 集 市 旬 辑 模型 由 哪些 事实 表 和 维 表 组 成 ， 事 实 表 与 哪些 维 表 进行 关联 ， 每 个 事实 表 需 要 
分 析 哪 些 指 标 。 通 第 ， 这 些 指 标 虱 是 数值 类 型 的 或 者 是 可 以 进行 计算 的 。 这 些 指标 关联 的 维 
度 通 常 是 时 间 、 地 区 、 类 型 等 数据 。 

(4) 确定 数据 集 市 的 存储 周期 

一 般 来 说 ， 数 据 集 市 的 数据 相对 稳定 ， 其 存储 周期 也 相对 较 长 。 业 务 合 询 比较 频 蚂 的 数 
据 需 要 长 期 存放 到 数据 集 市 中 ， 如 果菜 些 业 务 数据 的 使 用 频率 较 低 ， 旦 超过 了 存储 周期 ， 则 
存储 到 外 部 介质 上 ， 供 将 来 使 用 。 

2， 效 据 集 市 逻辑 模型 的 设计 过 程 

数据 集 市 饮 辑 桂 型 的 设计 过 程 是 通过 调研 的 结束 和 对 业务 规则 的 了 解 ， 逐 步 划分 主题 域 
的 过 程 。 通 过 对 实体 和 实体 关系 的 定义 描述 业务 之 间 的 关系 ， 同 时 拆 分 主题 ， 划 分 成 不 同 的 
由 标 和 维度 ， 最 后 形成 事实 表 和 维 表 。 在 需求 的 分 析 过 程 中 ， 需 要 确定 数据 集 市 逻辑 模型 的 
设计 范围 、 分 析 的 主题 ， 更 要 明确 数据 集 市 馆 辑 模型 的 数据 粒度 和 汇总 的 程度 。 

3. 数据 集 市 逻辑 模型 的 实例 

如 图 10-25 所 示 ， 客 户 实 体 作为 数据 集 市 的 事实 表 ， 客 性 编码、 地 址 编码 、 行 业 类 型 编 
人 码 、 客 户 信 用 编码 、 时 间 编 码 作为 维 表 。 它 们 应 该 隶属 于 客户 主题 。 客 记事 实 表 通 过 关联 5 
张 维 表 ， 可 以 从 客户 等 级 、 不 同 地 址 、 不 同行 业 、 客 户 的 信用 、 不 同 的 时 间 (年 、 月 、 H) 
等 多 角度 去 分 析 客 户 购买 商品 的 数量 ， 实 现 了 从 多 角度 奋 询 数据 的 功能 。 





































































































客户 等 级 编码 | 地 址 编码 
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图 10-25 ”数据 集 市 逻辑 模型 的 实例 
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模型 描述 见 表 10-14 一 表 10-19. 
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表 10-14 时 间 编 码 


中 文 属性 名 英文 属性 名 EREE 


表 10-15 客户 信用 编码 


号 中 文 属性 名 X Ji TE A 数据 类 型 





表 10-16 行业 类 型 编码 


中 文 属性 名 英文 属性 名 


数据 类 型 E f ÈE 





表 10-17 地 址 编码 


英文 属性 名 数据 类 型 





表 10-18 客户 等 级 编码 


中 文 属性 名 英文 属性 名 数据 类 型 





表 10-19 客户 


| | 0N- 
| [ON 
| | 
my xem | wm | ON 
mm | xm | | - 
[mem f mxm [em | 3 — 
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ZI|Z|IZ|~ 
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Z 


Hi 


Hi 


Hi 


Hi 


Hi 


10.5 物理 模型 的 设计 


10.5.1 ODS 物理 模型 的 设计 


1. ODS 物理 模型 的 设计 原则 

1) ODS 用 户 应 该 至 少 有 两 个 不 同 的 表 空 间 : 一 个 用 于 存放 数据 ;， 另 一 个 用 于 存放 索引 
数据 。 

2) ODS 用 户 如 果 存 在 大 数据 量 的 表 ， 可 以 考虑 为 该 表 建 并 分 区 以 改善 性 能 。 建 立 分 区 
有 哈 名 分区、 按时 间 范 围 进 行 分 区 等 方法 。 

3) ODS 用 户 中 如 果 存 在 需要 经 党 查询 的 字段 ， 应 该 考 上 处 是 否 可 以 建立 索引， 同时 应 该 
J58 STEMS RC EE ZR |. 

4) 对 于 一 些 大 表 ， 应 该 定期 搜集 统计 信息 给 Oracle 优化 器 ， 以 提高 系统 的 性 能 。 

2. ODS 物理 模型 的 作用 

1) 能 够 从 各 个 系统 抽取 企业 的 业务 数据 ， 通 过 ETL 完成 数据 的 整合 ， 为 企业 提供 全 局 
统一 的 数据 视图 。 

2) 为 企业 提供 数据 共享 的 功能 ， 消 除数 据 不 一 致 的 可 能 。 

3. ODS 物理 模型 的 实例 

用 户 基 本 信息 物理 表 主 要 存储 用 户 编写、 用 户 名 称 、 地 址 、 行 业 类 别 、 联 系 方式 等 学 
段 ， 地 区 编码 物理 表 主 要 存储 地 区 编码 、 地 区 名 称 罕 段 ， 如 图 10-26 所 示 。 其 中 用 户 基 本 信 
居 物 理 表 中 的 用 户 编 号 、 用 户 名 称 、 联 系 方式 都 是 从 源 系 统 中 直接 抽取 ， 地 址 、 行 业 类 别 根 
据 编 公 表 转换 得 到 |。 

































































用 户 基 本 信息 
用 户 编号 har2 (400) 
地 区 编码 | PAM vercher2(400) 
地 区 编码 varchar2(20) 地 址 varchar2 (400 
地 区 名 称 varchar2(200) 行业 类 别 varchar2(400 
联系 方 varchar2 (400 











图 10-26 ODS 物理 模型 实例 








部 分 地 区 的 编码 表 及 用 户 基本 信息 见 表 10-20 和 表 10-21. 


表 10-20 ”部 分 地 区 的 编码 表 


地 区 编码 名 W 
00001 朝阳 区 
00002 海淀 区 
00003 昌平 区 
00004 顺义 区 
00005 房山 区 
00006 西城 区 
00007 东城 区 
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表 10-21 用 户 基 本 信息 


名 m m 是 否 主键 ETL 转换 规则 
行业 类 别 根据 行业 类 别 代码 表 转 换 


总 结 : ODS 物理 模型 的 设计 主要 是 从 数据 存储 结构 、 子 段 的 索引 朱 略 等 物理 层面 进行 
设计 。 该 物理 模型 不 仅 整合 了 ETL 数据 抽取 的 基础 业务 数据 ， 同 时 也 是 业务 系统 数据 的 一 
个 规范 。ODS 数据 库 中 一 般 存 储 的 都 是 实时 性 的 数据 ， 同 时 设计 人 员 需 要 孝 夺 数据库 的 环 
境 ， 包 括 数 据 量 、 数 据 的 访问 频率 以 及 如 何 优 化 数据 的 存储 、 访 问 效 率 等 内 容 。 


10.5.2 ”数据 仓库 物理 模型 的 设计 


1. 数据 仓库 物理 模型 设计 原则 

1) 数据 仓库 物理 模型 设计 以 多 辑 模型 为 基础 ， 不 仅 需 要 郑 虑 数据 仓库 的 数据 存储 问 
题 ， 还 需要 考虑 数据 仓库 的 关系 模式 、 资 源 的 合理 应 用 等 情况 。 物 理 模 型 的 设计 是 数据 仓库 
实施 的 基础 架构 。 

2) 数据 仓库 需要 考虑 细 布 数据 、 汇 总 型 的 数据 。 除 了 设计 符合 要 求 的 数据 存储 结构 外 ， 
从 性 能 的 角度 来 说 ， 物 理 模型 的 设计 也 尽量 减少 表 乙 间 的 关联 ， 并 且 将 表 和 索引 存放 到 不 同 的 
表 空 间 中 。 

3) 数据 仓库 物理 模型 除了 满足 现 有 的 业务 框 染 外 ， 还 应 该 考虑 未 来 的 业务 扩展 等 需求 。 

2. 数据 仓库 物理 模型 的 作用 

1) 数据 仓库 物理 模型 文 持 企 业 的 决策 分 机 ， 并 且 能 够 根据 业务 的 需求 对 不 同 的 得 询 频 
率 采 取 不 同 的 设计 方法 。 

2) 数据 仓库 存储 了 大 量 的 历史 数据 ， 这 些 历史 数据 能 够 根据 物理 模型 组 织 成 统一 的 存 
储 模型 ， 包 括 对 数据 的 汇总 、 转 换 和 计算 ， 以 文 持 企 业 的 决策 分 析 。 

3) 数据 仓库 物理 模型 是 数据 仓库 逻辑 模型 在 数据 库 系统 中 的 实现 方式 。 

4) 数据 仓库 物理 模型 为 企业 各 级 业务 人 员 、 分 析 人 员 提 供 统一 的 数据 视图 。 

3. 数据 仓库 物理 模型 的 实例 

数据 仓库 物理 模型 的 实例 如 图 10-27 所 示 。 

地 区 编码 表 中 主要 存储 地 区 编码 、 地 区 名 称 子 段 ， 行 业 编 码 表 中 主要 存储 行业 类 型 编 
人 码 、 行 业 类 型 名 称 、 父 行业 类 型 编码 等 了 字段， 客户 历史 信息 物理 表 可 以 根据 客户 编号 子 段 与 
客户 物理 表 中 的 客户 编号 字段 关联 ， 计 算出 客户 从 不 同 视角 《例如 按照 不 同行 业 、 不 同 地 
区 ) 购买 商品 的 信息 。 

其 中 地 区 编码 表 的 示例 见 表 10-22. 

行业 编 翁 表 的 示例 见 表 10-23。 

客户 物理 表 的 示例 见 表 10-24。 
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varchar2(20) 《pk> 


地 区 编码 
地 区 和 名称 varchar2(400) 








客户 历史 信息 


客户 编号 varchar2(20) 《fk> 








FK 客户 历史 信息 _REFERENCE 客户 


客户 


FK REFERENCE 客户 编号 varchar2(20) <pk> 
-客户 - ] hd varchar2(20) <fk1> 
Tan varchar2(20) <fk2> 
[= 


H datetime 











| 
FK 客户 REFERENCE 行业 编码 


varchar2(20) 《pk> 
型 名 称 varchar2(400) 
类 型 编码 varchar2(20) 





pa 
X 
业 


行 
R^ 


业 
行 
图 10-27 数据 仓库 物理 模型 的 实例 


表 10-22 地 区 编码 表 


地 区 编码 地 区 名 称 
100001 北京 市 
100002 e 
100003 辽宁 省 
100004 黑龙 江 省 
100005 甘肃 省 
100006 陕西 省 
100007 TRA 
100008 四 川 省 


表 10-23 行业 编码 表 


行业 类 型 编码 行业 类 型 名 称 父 行 业 类 别 编码 
9001 互联 网 信息 服务 业 010 
9003 房屋 建筑 业 012 


表 10-24 客户 物理 表 


名 HW 编 — W 数据 类 型 
客户 编号 CustCode 
行业 类 型 编码 HyCode 
地 区 编码 AddrCode 


am 
i 
HH 
ËS 


Varchar2(14) 
Varchar2(60) 
Varchar2(60) 


ETL 转换 规则 
从 源 系 统 中 直接 抽取 


根据 行业 类 型 编码 表 转 换 





根据 地 区 编码 表 转 换 
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(8E) 
名 K 编码 数据 类 型 EET ETL 转换 规则 
购买 时 间 从 源 系 统 中 直接 抽取 
购买 商品 数量 从 源 系统 中 直接 抽取 


总 结 : 数据 仓库 物理 模型 是 决策 分 析 系 统 的 基础 架构 。 它 是 从 ODS 系统 中 抽取 实时 数 
据 ， 按 照 时 间 点 进行 的 数据 累积 ， 并 且 有 可 能 会 对 数据 进行 轻 度 的 汇总 和 相应 的 计算 和 和 转 
换 。 同 时 在 进行 数据 仓库 物理 模型 设计 时 ， 应 该 按照 主题 的 方式 对 物理 表 进 行 组 织 划 分 ， 可 
以 先 选择 小 部 分 很 重要 的 业务 主题 ， 最 后 逐步 扩展 到 所 有 的 业务 主题 中 。 由 于 数据 仓库 存储 
的 历史 数据 量 巨大 ， 所 以 应 优先 考虑 数据 库 的 存储 优化 。 为 了 保证 数据 仓库 系统 的 高 效 性 ， 
物理 表 多 采用 分 区 和 使 用 索引 的 方式 进行 设计 ， 同 时 也 要 适当 地 调整 数据 库 参 数 ， 增 加 内 存 
的 分 配 和 CPU 的 个 数 。 


10.5.3 ”数据 集 市 物理 模型 的 设计 


1. 数据 集 市 的 定义 和 结构 

数据 集 市 是 面 问 特 定 部 门 的 ， 是 数据 仓库 的 子 集 ， 其 数据 结构 一 般 包 括 星 形 结构 、 轨 伦 
形 结构 。 

星 形 结构 主要 包含 两 个 部 分 : 事实 表 和 维 表 。 事 实 表 主要 由 业务 相关 的 度量 值 和 与 维 
表 相 关联 的 字段 组 成 ， 例 如 人 员 信 息 事 实 表 ， 该 表 包 含 了 单位 编码 、 早 位 类 型 编码 、 部 门 
编 乌 、 性 列 编码 、 人 员 也、 年 龄 、 工 龄 等 信息 。 其 中 单位 编码 、 单 位 类 型 编码 、 部 门 纺 
码 、 性 别 编码 都 是 与 维 表 相 关联 的 字段 ， 工 龄 是 业务 相关 的 度量 值 。 维 表 用 于 存放 维度 的 
具体 信息 ， 例 如 单位 信息 维 表 、 单 位 类 型 维 表 、 部 门 维 表 、 性 别 维 表 等 。 星 形 结构 数据 集 
市 如 图 10-28 所 示 。 






























































单位 信息 维 表 单位 类 型 维 表 


单位 编码 varchar2(20) 《pk> 单位 类 型 编码 varchar2(20) 《pk> 


位 和 名称 varchar2(400) 单杠 类 型 名 称 varchar2(400) 





FK_ 人 员 信 息 表 _ REFERENCE_SK_ 人 员 信 息 表 _REFERENCE_ 单位 类 型 维 表 


A e OK 




















varchar2(20) <pk> 
单位 编码 varchar2(20) 《fkl> 
单位 类 型 编码 varchar2(20) 《fk2> 
部 门 编码 varchar2(20) 《fk3> 
性 别 编码 varchar2(20) <fk4> 


年 龄 integer 
integer 


Bk_ 人 员 信 Mk REFERENCE 部 门 维 表 FK_ 人 员 信 息 表 _REFERENCE_ 性 别 维 表 


性 别 维 表 


别 编 码 varchar2(20) 《pk> 


部 门 维 表 
部 门 编码 varchar2(20) «pk? 
部 门 名 称 varchar2(400) 





性 别名 称 varchar2(400) 





图 10-28 星 形 结构 数据 集 市 
由 图 10-28， 可 以 将 事实 表 理 解 成 为 通过 某 些 字段 进行 分 组 (例如 对 部 门 、 单 位 编码 、 
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单位 类型 、 性 别 进 行 分 组 )， 然 后 对 茶 些 度量 值 〈 例 如 针对 年 龄 求 平均 值 ) 进行 汇总 计算 的 
数据 集合 。 雪 花形 模式 是 在 星 形 模式 的 基础 上 ， 对 星 形 结构 的 一 种 拓展 。 通 过 对 星 形 结构 维 
表 的 规范 化 和 细 化 ， 逐 步 建 立 起 规范 的 第 三 范式 数据 结构 ， 这 种 结构 在 形式 上 很 像 雪 伦 的 形 
状 ， 所 以 被 称 为 雪花 形 结构 。 如 图 10-29 所 示 ， 单 位 闫 型 维 表 义 家 分 解 为 事业 单位 维 表 、 国 
有 企业 维 表 、 私 有 企业 单位 维 表 、 外 资 企 业 单 位 维 表 。 该 模型 完全 符合 第 三 范 陈 的 要 求 ， 规 
范 化 的 处 理 使 得 系统 更 容易 维护 和 更 新 ， 但 是 会 增加 会 询 关 联 的 条 件 ， 御 牲 一 定 的 系统 性 
能 。 总 之 ， 数 据 集 市 的 结构 是 采用 星 形 结构 还 是 雪人 花形 结 构 应 由 业务 需求 决定 。 















































事业 单 世 维 表 国有 企业 维 表 


事业 单位 编码 rarchar2(20) 《pky> 国有 企业 编码 varchar2(20) 《pk> 
事业 早 位 名 称 varchar2(400) 国有 企业 和 名称 varchar2(400) 


FK_ 单 位 类 型 维 表 _REFERENCE_ 事业 dé 位 类 型 维 表 _REFERENCE_ 国有 企业 维 表 









单位 类 型 维 表 





= T É varchar2(20) Xpk? 私有 企业 单位 维 表 
单位 信息 维 表 varchar2(20) <fk2> 私有 企业 编码 varchar2(20) «pk? 
音 varchar2(20) 《pky> 私有 企业 和 名称 varchar2(400) 
单位 和 名称 varchar2(400) 码 varchar2(20) 《fkd4> |FERENCE 
编码 varchar2(20) 《fk3> 








FK_ 人 员 信息 表 _REFEREIK_ 人 员 信息 表 _REFERENCE 单位 类 型 维 表 0 
e | FK 单位 类 型 维 表 _REFERENCE_ 外 资 企业 单位 维 表 





Adds X N 
RER varchar2(20) 《pk> 外 资 企 业 单 世 维 表 
PEEL. varchar2(20) 《fkl> JETER varcharz(20) «ub? 
Cd pwee—— HEIL AA verchr2(00) 7 
TE 3) varchar2(20) <fk4> 
Ei integer 
工龄 integer 





FK A, LS Bf REFERENCE, RETER A A IS SR REFERENCE JESIH 


部 门 维 表 性 别 维 表 


部 门 编码 varchar2(20) 《pk> 性 别 编 码 varchar2(20) 《pk> 
NAR varchar2(400) 性 别名 称 varchar2(400) 


图 10-29 雪花 形 数据 集 市 


2. 数据 集 市 的 作用 和 特点 

数据 集 市 的 作用 和 特点 《〈 见 图 10-30) 有 以 下 几 个 方面 : 

1) 数据 集 市 主要 针对 企业 的 茶 个 只 体 部 门 ， 或 者 茶 些 个 性 化 的 应 用 。 数 据 集 市 设计 
开发 的 复杂 上 度 和 周期 相对 于 数据 仓库 来 说 较 小 ， 用 户 可 以 很 快 地 从 数据 集 市 中 获得 需要 
的 信息 。 

2) 数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 被 看 做 是 数据 仓库 的 子 集 ， 主 要 面 辐 特定 
的 应 用 。 

3) 数据 集 市 主要 包含 两 种 类 型 的 数据 : 汇总 型 数据 和 详细 数据 。 

4) 数据 集 市 的 维 表 主 要 是 围绕 事实 表 建 立 起 来 的 ， 它 和 事实 表 是 主键 与 外 键 的 关系 。 

3. 数据 集 市 的 构建 方法 

(1) 构建 数据 集 市 的 一 般 方法 

构建 数据 集 市 的 一 般 方 法 是 : 通过 ETL 工具 将 业务 系统 中 的 源 数据 抽取 到 数据 仓库 
中 ， 再 经 过 多 次 数据 抽取 、 清 洗 、 转 换 、 加 载 ， 最 后 汇总 到 数据 集 市 中 ， 从 而 保证 数据 的 
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一 致 性 ， 有 利于 构建 各 部 门 级 别 的 决策 分 析 系 统 。 但 是 这 种 普通 的 构建 方法 一 般 来 说 开发 
的 周期 相对 较 长 ， 开 发 成 本 也 较 局 ， 不 易于 针对 用 户 的 意见 及 时 进行 修改 ， 灵 活性 相对 较 
兰 ， 但 是 它 的 数据 质量 较 遍 ， 并 且 能 够 你 证 数据 的 一 致 性 和 稳定 性 。 图 10-31 所 示 为 构建 
数据 集 市 的 一 般 方 法 。 








数据 集 市 主要 针对 企业 的 具体 某 个 部 门 ， 或 者 茶 些 个 性 化 的 应 用 





数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 看 做 是 数据 仓库 的 子 集 


是 型 的 数据 和 详细 数据 








图 10-30 ”数据 集 市 的 作用 和 特点 





图 10-31 构建 数据 集 市 的 一 般 方 法 


(2) 构建 数据 集 市 的 特殊 方法 








构建 数据 集 市 的 特殊 方法 是 : 和 完 设 计 和 开发 小 部 门 级 别 的 数据 集 市 ， 然 后 再 通过 逐渐 化 
增 的 方式 慢 慢 扩大 数据 集 市 的 规模 ， 最 后 将 各 个 数据 集 市 集成 到 数据 仓库 中 。 这 种 方法 开发 
周期 较 短 ， 开 发 成 本 较 低 ， 能 针对 用 户 意 见 及 时 进行 修改 和 调整 ， 不 仅 增 加 了 开发 的 灵活 
性 ， 也 弥补 了 从 籽 务 源 数据 抽取 到 数据 仓库 中 ， 再 经 过 数据 的 抽取 、 清 洗 、 转 换 、 加 载 ， 最 
后 汇总 到 数据 集 市 中 的 缺陷 。 但 是 这 种 方法 有 一 定 的 局 限 性 ， 首 先 从 数据 集 市 集成 到 数据 仓 
库 中 ， 因 为 业务 规则 的 不 同和 数据 格式 的 不 一 致 性 ， 增 大 了 集成 的 困难 ， 同 时 由 于 数据 集 市 
的 逐渐 增多 ， 用 户 进行 必要 的 关联 得 询 和 交叉 得 询 ， 会 增 大 数据 集 市 乙 间 关联 的 复杂 度 ， 降 
低 系统 的 性 能 ， 同 时 也 会 影响 数据 集 市 集成 到 数据 仓库 中 的 效率 。 图 10-32 所 示 为 构建 数据 
集 市 的 特殊 方法 。 
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图 10-32 构建 数据 集 市 的 特殊 方法 


(3) 构建 数据 集 市 的 混合 型 方法 

结合 上 和 面 两 种 方法 的 优 缺 点 ， 人 们 通常 希望 既 能 乡 短 开发 周期 ， 减 少 成 本 ， 增 大 开发 的 
灵活 性 ， 同 时 又 能 及 时 地 根据 用 户 的 需求 和 意见 进行 相应 的 调整 和 修改 ， 保 证 数据 的 一 任性 
和 数据 的 质量 ， 所 以 出 现 了 构建 数据 集 市 的 混合 型 方法 ， 如 图 10-33 所 示 。 首 先 根 据 业 务 需 
求 ， 业 务 源 数据 经 过 ETL 过 程 将 数据 抽取 a 到 企业 的 数据 仓库 中 ， 数 据 仓 库存 储 了 大 量 的 历 
史 数 据 、 汇 总 的 数据 和 共 孕 的 数据 ， 同 时 部 门 级 别 的 数据 集 市 经 过 ETL 过 程 下 接 从 源 数 据 
中 抽取 数据 ， 并 且 加 载 到 数据 集 市 中 。 各 部 门 的 决 倘 分 析 者 可 以 直接 从 数据 集 市 中 获得 决 集 
信息 ， 并 能 迅速 地 作出 决断 。 数 据 集 市 中 有 一 部 分 数据 经 过 汇总 或 者 计算 ， 直 接 将 历史 数据 
或 者 共 衬 数据 加 载 到 数据 仓库 中 ， 这 样 既 减 少 了 开发 的 成 本 ， 同 时 又 保证 了 数据 的 一 致 性 ， 
JF Epi Ae T VRAT TK o 


T 部 门 级 别 的 决策 
决策 分 析 者 分 析 老 


iti 


数据 仓库 



































i] 
ETL 过 程 
i Áh 一- i e 


源 数据 源 数据 源 数据 源 数据 源 数据 源 数据 


图 10-33 ”构建 数据 集 市 的 混合 型 方法 


总 结 : 不 论 选择 哪 种 构建 数据 集 市 的 方法 ， 虱 是 由 数据 集 市 所 属 部 门 的 需求 决定 的 。 只 
有 通过 对 现 有 应 用 系统 的 分 析 和 对 业务 需求 的 理解 ， 才 能 制定 出 合适 的 构建 数据 集 市 的 方法 。 

4. 数据 集 市 物理 表 的 命名 规则 和 创建 过 程 

数据 集 市 的 事实 表 结 构 命 名 规则 一 般 是 FACT 所 在 主题 域 的 英文 简写 表 的 名 称 ， 例 如 
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FACT ORGAN PERSONINFO. 

数据 集 市 的 维 表 结构 命名 规则 一 般 是 DIM 所 在 主题 域 的 英文 简写 表 的 名 称 ， 例 如 
DIM ORGAN GENDER. 

创建 事实 表 的 过 程 如 下 : 

D 为 事实 表 中 的 每 个 维 建立 外 键 ， 与 维度 表 中 的 主键 进行 关联 。 

2) 为 事实 表 至 少 建 立 一 个 度量 字段 。 

3) 为 事实 表 建 立 适 当 的 索引 ， 以 提高 查询 效率 。 

创建 维 表 的 过 程 如 下 : 

1) 为 每 个 维 表 建立 关键 字段 。 

2) 为 每 个 维 表 建 立 各 自 的 属性 字段 ， 例 如 性 别 维 表 ， 它 的 关键 字段 是 GENDER ID, 
它 的 属性 字段 就 是 GENDER NAME， 用 以 描述 每 个 关键 字段 对 应 一 个 名 称 值 。 

3) 为 维 表 建 立 必 要 的 约束 条 件 。 




















10.0 kx LE 





1) ODS 是 各 个 业务 系统 之 间 共 至 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 
之 间 的 缓冲 区 。 

2) 数据 仓库 是 一 个 面 癌 主题 的 、 集 成 的 、 不 易 丢 失 的 ， 并 且 随 时 间 变 化 的 帮助 企业 管 
理 人 员 决 策 分 析 的 数据 集合 。 

3) 数据 集 市 是 在 数据 仓库 的 基础 上 创建 起 来 的 ， 根 据 各 个 业务 部 门 的 不 同 需 要 ， 对 数 
据 仓 库 中 的 数据 进行 高 度 汇 上 总、 计算 。 数 据 集 市 的 作用 是 创建 一 组 特定 的 、 针 对 菏 个 主题 域 
或 者 部 门 的 特殊 数据 集合 。 一 般 来 说 ， 数 据 集 市 的 模型 都 采用 星 形 模式 或 雪花 形 柑 式 。 

4) 企业 数据 模型 转换 到 数据 仓库 数据 模型 的 步 又 ，Q 在 企业 模型 中 有 条 件 地 选择 数据 
仓库 需要 的 数据 。 包 为 企业 模型 的 每 个 实体 都 增加 时 间 键 。 包 确定 数据 仓库 的 粒度 。 多 汇总 
企业 模型 中 的 数据 。 久 根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 。 

5) 概念 模型 是 最 高 层次 的 数据 模型 ， 它 定义 了 核心 的 业务 概念 及 其 关系 。 概 念 模型 的 
分 析 通 关 是 以 企业 模型 为 基础 的 ， 而 企业 模型 主要 描述 企业 内 部 的 组 织 结 构 和 企业 经 营 活 动 
状况 等 信息 。 

6) ODS 浊 辑 模型 设计 是 通过 ODS 统一 信息 视图 区 集成 各 类 业务 系统 的 源 数 据 ， 以 数 
据 主 题 域 作为 设计 的 基础 。ODS 统一 信息 视图 区 有 选择 性 地 集成 各 类 业务 系统 的 数据 ， 通 过 
ETL 数据 抽取 、 转 换 、 加 载 与 业务 系统 进行 交互 ， 它 主要 保存 与 主题 相关 的 、 实 时 性 的 信 
县 ， 因 此 ODS 统一 信息 视图 区 具有 准 实 时 性 的 特点 :而 业务 系统 的 数据 通过 一 定 的 时 间 间 
隔 ， 最 终 以 主题 的 形式 反映 到 ODS 统一 信息 视图 区 中 。 

7) 数据 仓库 多 辑 模 型 是 对 概念 模型 的 进一步 细 化 和 分 解 ， 主 要 描述 了 实体 、 属 性 以 及 
实体 之 间 的 关系 。 

8) 数据 集 市 是 针对 特定 的 茶 个 主题 域 ， 或 者 按照 部 门 进行 划分 的 数据 集合 。 

9) ODS 物理 模型 的 作用 。GD 能 够 从 各 个 系统 抽取 企业 的 业务 数据 ， 通 过 ETL 完成 数据 
的 整合 ， 为 企业 提供 全 局 统一 的 数据 视图 。 包 为 企业 提供 数据 共 孚 的 功能 ， 消 除数 据 不 一 致 
的 可 能 。 
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据 业 务 的 需求 对 不 同 的 奋 询 频率 采取 不 同 的 设计 方法 。 色 数据 仓库 存储 了 大 量 的 历史 数据 ， 
这 些 历史 数据 能 够 根据 物理 模型 组 织 成 统一 的 存储 模型 ， 包括 对 数据 的 汇总 、 转 换 和 计算 ， 
以 支持 企业 的 决 打分 析 。(8) 数 据 仓 库 物 理 模 型 是 数据 仓库 迪 辑 模型 在 数据 库 系 统 中 的 实现 方 
式 。() 数 据 仓 库 物理 模型 为 企业 各 级 业务 人 员 、 分 析 人 员 提 供 统 一 的 数据 视图 。 

11) 数据 集 市 是 面 疝 特定 部 门 的 ， 是 数据 仓库 的 子 集 ， 其 数据 结构 一 般 包 括 星 形 结构 、 
雪人 花形 结构 。 星 形 结构 主要 包含 两 个 部 分 : 事实 表 和 维 表 。 事 实 表 主 要 由 业务 相关 的 度量 值 
和 与 维 表 相 关联 的 字段 组 成 。 雪 花形 模式 是 在 星 形 模式 的 基础 上 ， 对 星 形 结构 的 一 种 拓展 。 
通过 对 星 形 结 构 维 表 的 规范 化 和 细 化 ， 逐 步 建立 起 规范 的 三 范式 数据 结构 ， 这 种 结构 在 形式 
上 很 像 雪 人 花 的 形状 ， 所 以 被 称 为 雪花 形 结构 。 

12) 数据 集 市 的 作用 和 特点 。( 册 数据 集 市 主要 针对 企业 的 其 体 某 个 部 门 ， 或 者 菜 些 个 性 
化 的 应 用 。 数 据 集 市 设计 开发 的 复杂 度 和 周期 相对 数据 仓库 来 说 较 小 ， 用 户 可 以 很 快 地 从 数 
据 集 市 中 获得 需要 的 信息 。 色 数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 被 看 做 是 数据 仓库 的 子 
集 ， 主 要 和 面向 特定 的 应 用 。(3) 数 据 集 市 主要 包含 两 种 类 型 的 数据 :汇总 型 数据 和 详细 数据 。 
由 数据 集 市 的 维 表 主要 是 围绕 事实 表 建 立 起 来 的 ， 它 和 事实 表 是 主键 与 外 键 的 关系 。 

13) 数据 集 市 的 构建 方法 。(D 构 建 数据 集 市 的 一 般 方 法 是 : 通过 ETL 工具 将 业务 系统 
中 的 源 数 据 抽取 到 数据 仓库 中 ， 再 经 过 多 次 数据 抽取 、 清 洗 、 转 换 、 加 载 ， 最 后 汇总 到 数据 
集 市 中 。 凶 构建 数据 集 市 的 特殊 方法 是 : 先 设计 和 开发 小 部 门 级别 的 数据 集 市 ， 然 后 再 通过 
逐渐 递增 的 方式 ， 慢 慢 扩 大 数据 集 市 的 规模 ， 最 后 将 各 个 数据 集 市 集成 到 数据 仓库 中 。G@) 构 
建 数 据 集 市 的 混合 型 方法 是 : 首先 根据 业务 需求 ， 业 务 源 数 据 经 过 ETL 过 程 将 数据 抽取 到 
企业 的 数据 仓库 中 ， 数 据 仓 库存 储 了 大 量 的 历史 数据 、 汇 总 的 数据 和 共 孚 的 数据 ， 同 时 部 门 
级 列 的 数据 集 市 经 过 ETL 过 程 直 接 从 源 数据 中 抽取 数据 ， 并 且 加 载 到 数据 集 市 中 ， 数 据 集 
市 中 有 一 部 分 数据 经 过 汇总 或 者 计算 ， 直 接 将 历史 数据 或 者 共 吝 数据 加 载 到 数据 仓库 中 。 
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Sb ME RERA s GE IDEM SA 


本 章 目标 

通过 本 章 的 学 习 ， 该 者 会 熟悉 商业 智能 决策 分 析 系 统 部 普 的 一 般 步 又 和 方法 ， 包 括 如 何 
定义 数据 仓库 项 目的 生命 周期 ， 数 据 仓 库 粒 度 划分 ， 企 业 辅助 决策 分 析 系 统 构建 的 过 程 ， 系 
统 软件 的 体系 结构 、 数 据 流 加 的 体系 结构 、 业 务 库 环境 的 部 敬 、ODS 环境 的 部 普 、 数 据 仓 库 
和 数据 集 市 环境 的 部 普 、ETL 和 报表 展示 环境 的 部 轩 等 内 容 。 

FASE, KKE: 

e 如 何 定义 数据 仓库 项 目的 生命 周期 。 

e 数据 仓库 粒度 的 划分 。 

e 企业 辅助 决策 分 析 系 统 的 构建 。 

e 商业 智能 决策 分 析 系 统一 般 的 部 车 方 宁 和 步 缀 。 











11.1. 定义 数据 仓库 项 目的 生命 周期 





为 了 达到 数据 仓库 项 目 质量 管理 的 要 求 ， 可 以 选择 合适 的 模型 建立 数据 仓 库 项 目的 生命 
周期 。 例 如 ， 用 瀑布 模型 或 者 原型 模型 定义 生命 周期 。 

(1) 使 用 瀑布 模型 的 条 件 

从 用 户 的 角度 来 说 ， 他 们 已 经 完全 理解 项 目的 需求 ， 并 且 有 现成 的 文档 作为 文 持 ， 同 时 
用 户 希 望 用 新 系统 答 代 旧 的 系统 ， 并 且 项 目 工期 相对 楷 迫 。 

从 项 目 开发 人 员 的 角度 来 说 ， 项 目 分 工 明 确 ， 资 源 充 足 ， 系 统 可 以 极 划 分 成 相对 独立 的 
模块 ， 比 较 适 合 工作 任务 的 分 配 。 

(2) 使 用 原型 模型 的 条 件 

没有 完整 的 需求 定义 ， 系 统 开 发 的 规模 过 于 庞大 ， 没 有 现成 的 文档 文 持 ， 用 户 对 项 目 需 
求 的 理解 比较 模糊 。 

项 目的 生命 周期 主要 包含 以 下 几 个 部 分 : 需求 分 析 、 构 建 数据 模型 、 应 用 功能 的 开发 和 
测试 、 系 统 实施 和 部 着、 系统 运行 并 验收 ， 如 图 11-1 所 示 。 其 中 ， 需 求 分 析 包 括 : 需求 调 























系统 in 
@ 应 用 实施 E 
构建 ”功能 和 验收 
@ ”数据 的 m 7 
需求 模型 发 和 
分 析 测试 


图 11-1 项 目的 生命 周期 


E 
E 


118 


研 ， 需 求 得 到 用 户 确 认 ， 建 立 一 套 验收 标准 。 应 用 功能 的 开发 和 测试 包括 : 系统 总 体 的 设 
计 、ETL 的 设计 、 报 表 展现 的 设计 ， 对 应 用 系统 的 单元 测试 、 集 成 测试 、 用 户 测试 。 系 统 实 
施 和 部 署 包括 : 数据 仓库 系统 的 部 署 ， 数 据 的 初始 化 工作 ， 对 用 户 的 系统 培训 ， 整 体 功能 测 
试 等 工作 。 系 统 运行 并 验收 包括 : 用 户 的 集中 使 用 ， 系 统 是 否 达 到 预期 目标 ， 系 统 的 调 优等 
内 容 。 


11.2. 数据 仓库 粒度 的 划分 


数据 仓库 粒度 的 划分 是 设计 的 重要 内 容 ， 因 为 它 和 直接 影响 了 数据 仓库 得 询 的 效率 、 答 询 
的 灵活 性 和 数据 仓库 数据 量 的 大 小 。 所 谓 粒 度 ， 是 指数 据 仓 库 中 单位 数据 细 化 程度 的 高 低 ， 
如 来 单位 数据 的 细 化 程度 越 蜗 ， 说 明 数 据 仓库 粒 撒 的 级 别 越 低 ， 反 之 ， 则 相反 。 

图 11-2 所 示 为 我 国 3 个 月 之 内 各 个 地 区 地 震 活 动 的 细节 和 3 个 月 之 内 各 个 地 区 地 震 活 
动 的 综合 情况 。 























低 细 市 级 


发 震 时 刘 
纬度 


平均 震级 


经 度 
深度 
震级 


地 区 


地 震 的 次 数 


影响 地 区 的 数量 





图 11-2 MATRAKA 


图 11-2 是 粒度 问题 的 一 个 例子 ， 左 赂 是 一 个 细 克 化 程度 高 ， 粒 度 级 别 低 的 例子 ， 每 次 
地 震 活 动 的 日 期 、 地 震 时 刻 都 被 详细 记录 下 来 。 粒 度 级 别 低 ， 可 以 问答 大 量 的 问题 ， 例 如 在 
不 同 的 日 期 时 段 内 ， 不 同 的 纬度 、 经 度 、 深 度 、 震 级 等 地 震 情 况 的 详细 信息 ， 但 是 数据 存储 
量 巨 大 ， 占 用 的 空间 多 。 右 图 是 一 个 细节 化 程度 低 ， 但 是 粒度 级 别 高 的 例子 ， 记 录 了 3 个 月 
之 内 ， 总 的 地 震 次 数 ， 影 啊 地 区 的 数量 等 综合 信息 ， 这 样 可 以 大 大 记 省 存储 空间 ， 奏 询 的 效 
率 也 随 乙 捉 高 ， 但 是 得 询 的 有 灵活 性 却 降 低 了 ， 其 问题 处 理 能 力也 相应 减弱 了 。 所 以 在 数据 仓 
库 设 计 过 程 中 ， 应 该 慎重 考虑 粒度 的 问题 ， 既 要 满足 所 有 的 合 询 需求 ， 也 需要 考虑 合 询 的 效 
率 、 存 储 的 空间 等 情况 。 


11.3 企业 辅助 决策 分 析 系 统 的 构建 


企业 辅助 决策 分 析 系 统 侧重 于 决策 分 析 ， 实 现 从 不 同 地 区 、 不 同时 间 、 不 同行 业 每 多 种 
角度 对 具体 指标 的 分 析 ， 从 而 文 持 业务 的 各 种 分 析 需 求 。 在 企业 辅助 决策 分 析 系 统 中 ， 报 表 
展示 、 应 用 分 析 和 数据 集 市 的 构建 多 采用 专业 的 商业 智能 工具 ， 数 据 仓 库 、ODS 统一 信息 视 
图 区 多 采用 数据 仓库 的 技术 进行 构建 ， 最 下 层 的 信息 系统 是 基于 大 量 的 业务 明细 数据 ， 如 
图 11-3 所 示 。 
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N 
数据 仓库 


ODS 统一 信息 视图 区 


信息 系统 信息 系统 














信息 系统 


图 11-3 企业 辅助 决策 分 析 系统 的 构建 
1.4 ”决策 分 析 系 统一 般 的 部 署 方案 和 步 又 


11.4.1 提供 系统 安装 软件 的 体系 结构 


1. 软件 部 署 的 体系 结构 

在 图 11-4 中 议定 ETL 工具 为 Informatica， 报 表 展 示 工 具 为 Cognos，Web 应 用 服务 占 是 
WebLogic， 数 据 库 服务 需 为 Oracle 10g。 其 中 Cognos 部 著 的 资料 库 必 须 是 UTF-8 FIRR 
型 。Cognos 服务 器 义 包 售 了 Server、Framework、Transformer， 具 体内 容 将 在 工具 篇 中 详细 


介绍 ， 在 此 不 再 次 述 。 
























Oracle 服务 器 Cognos AR 23 
Informatica 服务 器 WebLogic 服务 器 


图 11-4 系统 软件 部 普 环 境 
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2. 数据 流向 的 体系 结构 
在 图 11-5 中 可 以 看 出 : 数据 从 业务 库 流 向 ODS 统一 信息 视图 区 ， 再 从 ODS 统一 信息 
视图 区 流 问 数据 仓库 ， 最 后 从 数据 仓库 流 问 数据 集 市 ， 报 表 展 示 是 从 数据 集 市 中 获取 数据 。 














报表 展示 报表 展示 








= 数据 抽取 
-E 


à 





图 11-5 数据 流 问 的 体系 结构 


11.4.2 ”部署 系统 的 数据 库 环 境 


1. 业务 库 环 境 的 部 署 

D 建立 业务 数据 库 的 表 衬 间 ， 创 建 业务 数据 库 用 户 ， 同 时 为 业务 用 户 赋予 相应 的 权限 。 
2) 导入 业务 数据 。 

3) 测试 是 否 成 功 建立 业务 数据 库 环 境 。 

2. ODS 数据 库 环境 的 部 署 

D 为 ODS 数据 库 环 境 建 立 独立 的 表 空 间 。 

2) 创建 ODS 数据 库 用 户 ， 并 且 为 用 户 赋予 相应 的 权限 。 

3) 导入 ODS 数据 。 

4) 更 狐 相 应 的 数据 库 链 接 。 

5) 测试 是 否 成 功 建立 ODS 数据 库 环境 。 

3. 数据 仓库 和 数据 集 市 环境 的 部 署 

D 建立 数据 仓库 和 数据 集 市 的 数据 库 用 户 ， 并 且 为 用 户 赋予 相应 的 权限 。 
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2) 执行 导入 表 结 构 和 数据 的 SQL 脚本 。 
3) 建立 连接 数据 仓库 和 数据 集 市 的 数据 库 链 接 。 
4) 测试 数据 仓库 和 数据 集 市 的 环境 是 否 成 功 。 


11.43 ETL 环境 的 部 团 


下 和 面 以 Informatica 为 例 描述 对 ETL ANS) o 

D 对 资料 库 的 备份 。 进 入 ETL 后 人 台 ， 选 定 资 料 库 ， 配 置 相 关 信 息 ， 将 资料 库 备 份 到 便 
盘 茶 个 目录 下 。 

2) 对 资料 库 的 部 畴 。 进 入 ETL 后 台 ， 选 中 需要 部 着 的 目标 知识 库 ， 将 备份 的 知识 库 复 
制 到 ETL ZR Hx T. pain 

3) 测试 ETL Jl ot dee MERE. EA aa HA http:/+P 地 址 : mo, StAJST: 
HHSEN, RAR HESIAREN IE o 
11.4.4. REIER 

Fifi EA Cognos 为 例 描述 报表 展示 环境 的 部 署 。 

1) 首先 把 .zip 包 放 人 到 Cognos 安装 日 录 deployment 下 。 

2) JEDE DU as X FE RAE zip 包 。 

3) 修改 配置 信息 ， 进 入 到 Cognos 门户 页 面 ， 修 改 数据 库 的 配置 信息 。 

4) WIESE TS IER. 


11.9 数据 仓库 建设 的 难点 





























数据 仓库 建设 最 大 的 难点 就 是 数据 质量 的 问题 。 我 们 可 以 把 数据 仓库 质量 存在 问题 的 原 
因 归 为 以 下 儿 类 : 

(1) 数据 格式 问题 ， 例 如 数据 的 缺失 、 超 出 了 数据 范围 、 无 效 数据 格式 等 。 

(2) 数据 一 任性 问题 ， 出 于 性 能 考虑 ， 可 能 会 去 挥 一 些 外 键 或 者 检 醋 约束 ， 这 样 可 能 会 
导致 出 现 数据 一 致 性 的 问题 。 

(3) 业务 饮 辑 问题 ， 通 单 是 由 于 数据 库 设 计 出 现 问题 所 致 。 

原因 分 析 和 解决 思路 : 

(1) 我 们 在 构造 数据 仓库 的 时 候 ， 如 采 数 据 质 量 得 不 到 保证 ， 在 后 续 的 构建 过 程 中 ， 数 
气质 量 所 引发 的 问题 会 逐渐 被 放大 。 

(2) 数据 质量 问题 会 员 穿 于 项 目的 整个 生命 周期 ， 所 以 必须 面 对 并 且 给 出 解决 办 法 ， 尺 
量 把 影响 减 小 到 最 少 。 

(3) 技术 检测 数据 仓库 的 质量 的 方法 有 多 种 。 例 如 第 一 种 方法 ， 对 于 记录 级 的 ， 可 以 先 
分 离 出 主 表 ， 再 验证 目标 表 和 源 表 中 主 表 的 记录 数 是 否 一 致 。 第 二 种 方法 ， 对 于 字段 级 别 
的 ， 例 如 有 两 个 团队 ， 一 个 是 开发 组 ， 故 外 是 数据 质量 组 ， 当 开发 组 抽取 出 数据 后 ， 再 由 数 
据 质量 组 通过 业务 规则 编写 验证 脚本 ， 验 证 两 边 的 结束 是 否 保持 一 致 。 第 三 种 方法 ， 寻 找 不 
辣 目 标 表 中 相同 口径 的 值 ， 验 证 数据 是 售 一 致 。 

(4) 在 大 多 数 情况 下 ， 解 次 数据 仓库 质量 最 根本 的 方法 就 是 从 源头 解决 质量 的 问题 ， 但 
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是 这 种 方式 需要 投入 很 多 的 人 力 成 本 和 时 间 。 

(5) 可 以 通过 手工 方式 对 数据 仓库 问题 进行 处 理 。 

1) 采用 抽样 、 统 计 分 析 等 技术 手段 捉 高 数据 的 质量 : 对 于 数据 仓库 来 说 ， 它 主要 存储 
的 是 大 量 的 历史 数据 ， 所 以 无 形 当 中 加 大 了 数据 质量 检查 的 难度 ， 如 何 保证 进入 到 数据 仓库 
中 的 数据 是 高 质量 的 呢 ? 我 们 可 以 采用 抽样 和 统计 分 析 等 技术 手段 提高 数据 的 质量 ， 并 且 可 
以 保持 数据 仓库 的 高 效 性 。 

2) 采用 两 站 对 比 等 手段 确 你 数据 质量 : 对 于 数据 仓库 的 数据 质量 来 说 ， 它 可 以 进行 入 
库 时 的 格式 校 验 和 风 辑 校 验 ， 当 入 库 后 ， 再 通过 两 端 对 比 等 手段 确保 数据 质量 ， 所 谓 两 病 对 
比 是 指 将 源 系统 抽取 出 一 部 分 数据 再 和 数据 仓库 中 的 一 部 分 数据 进行 核对 。 




















11.0 ”本章 小 结 


1) 数据 仓库 项 目的 生命 周期 包括 需求 分 析 、 构 建 数据 模型 、 应 用 功能 的 开发 和 测试 、 
系统 实施 和 部 署 、 系 统 运行 并 验收 。 

2) 数据 仓库 粒度 的 划分 是 设计 的 重要 内 容 ， 因 为 它 将 直接 影响 数据 仓库 得 询 的 效率 、 
得 询 的 灵活 性 和 数据 仓库 数据 量 的 大 小 。 

3) 粒度 是 指数 据 仓库 中 单位 数据 细 化 程度 的 高 低 ， 如 果 数 据 单 位 的 细 化 程度 越 高 ， 说 
明 数 据 仓库 粒度 的 级 别 越 低 ; RZ, MRE o 

4) 企业 辅助 决策 分 析 系 统 侧重 于 面 问 分 析 决 策 ， 实 现 从 不 同 地 区 、 不 同时 间 、 不 同行 
业 等 多 种 角度 对 有 具体 指标 的 分 机 ， 从 而 文 持 业务 的 分 析 需 求 。 

5) UU AT MT RE RE D JJ AER: 提供 系统 安装 软件 的 体系 结构 ， 提 供 系 统 的 
数据 库 环 境 ， 对 ETL 和 报表 展示 环境 进行 部 各 。 
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第 12 5€ 商业 银行 数据 仓库 建议 规划 


本 章 目标 

FASE, KKE: 

e 商业 智能 数据 仓库 建设 概况 。 

e 商业 银行 效 据 仓 库 建 设 思路 及 系统 情况 。 
e 商业 银行 数据 仓库 建设 的 局 示 。 


12.1 商业 银行 数据 仓库 建设 概况 





国内 商业 银行 数据 仓库 的 建设 一 般 虱 米 用 分 阶段 建设 的 策略 : 

首先 ， 实 现 对 数据 的 集中 处 理 ， 对 重要 报表 系统 提供 数据 的 文 持 。 

其 次 ， 实 现 灵活 报表 的 得 询 和 复杂 的 管理 分 析 关 应 用 。 例 如 ， 资 产 负 俩 管理 和 客户 关系 
管理 等 。 


最 后 开展 数据 挖 抉 分析， 实施 商业 智能 等 应 用 。 





12.2 目前 国内 商业 银行 数据 仓库 面临 的 瓶 闯 


目前 商业 银行 数据 仓库 面临 的 诅 贷 可 以 从 四 个 方面 说 明 ， 包 括 : 业务 价值 、 系 统 性 能 、 
数据 质量 、 后 续 运 维 ， 如 图 12-1 所 示 : 
业务 价值 系统 性 能 数据 质量 














图 12-1 目前 商业 银行 效 据 仓库 面临 的 瓶颈 


a) 业务 价值 

对 于 大 部 分 的 商业 银行 来 说 ， 数 据 仓 库 基 本 上 停留 在 业务 报表 和 供 数 层 面 上 ， 业 务 价值 
体现 得 不 够 充分 。 事 实 上 ， 商 业 银 行 有 大 量 的 数据 ， 有 的 银行 也 做 了 很 多 的 数据 分 析 ， 但 是 
大 多 没有 把 业务 分 析 结 果 转 换 为 业务 行动 。 在 国外 ， 很 多 银行 都 会 把 分 析 结 果 转 变 成 业务 规 
则 或 者 是 业务 事件 ， 然 后 和 银行 的 业务 系统 揉 合 到 一 起 ， 最 终 形成 一 个 闭环 结构 。 国 内 商业 
银行 的 高 端 分 析 应 用 不 多 ， 也 就 是 没有 把 对 业务 的 分 析 结 果 转 换 为 业务 行动 。 
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(20 系统 性 能 

对 于 商业 银行 来 说 ， 有 时 数据 仓库 系统 的 数据 链 路 会 过 长 ， 例 如 数据 从 核心 业务 系统 加 
载 下 来 ， 然 后 再 通过 交换 系统 、 组 冲 区 ， 经 过 ETL 加 工 ， 最 后 到 应 用 系统 。 这 种 情况 必须 
考虑 数据 的 混合 负载 ， 也 就 是 数据 的 加 载 、 数 据 的 加 工 和 前 并 的 访问 同时 进行 ， 可 以 进行 批 
量 加 载 和 实时 加 载 。 这 种 工作 负载 是 混合 的 ， 需 要 重点 考虑 资源 的 分 配 问 题 。 

(3) 数据 质量 

对 于 大 部 分 商业 银行 来 说 ， 基 本 上 都 是 先 有 数据 仓库 ， 然 后 再 进行 数据 标准 的 建设 ， 这 
就 导致 标准 很 难 在 数据 仓库 中 落地。 大 部 分 商业 智能 系统 实施 了 数据 质量 检查 程序 ， 对 数据 
仓库 的 上 游 、 中 游 和 下 游 进行 全 周期 的 管理 ， 所 以 需要 统一 起 来 。 

(4) 后 续 运 维 

当 数 据 仓 库 建 设 好 之 后 ， 每 天 都 需要 加 载 数 据 。 如 条 有 狐 的 数据 源 加 进来 ， 模 型 可 能 需 
要 进行 相应 的 变化 ， 同 时 ETL 程序 也 需要 修改 ， 维 护 的 工作 量 是 非常 大 的 。 还 需要 考虑 数 
据 的 目 助 服务 ， 开 发 数据 接口 ， 也 就 是 说 业务 人 员 可 以 通过 接口 自助 服务 ， 目 主 地 取 数 。 但 
是 一 般 来 说 ， 这 种 灵活 得 询 不 能 全 部 开放 ， 因 为 数据 仓库 的 数据 量 非常 巨大 ， 有 可 能 一 个 得 
询 会 影响 整个 仓库 系统 的 效率 。 所 以 对 于 得 询 只 能 开放 一 些 汇总 层 的 数据 ， 对 于 明细 基础 层 
和 交易 层 的 数据 是 不 能 开放 的 。 












































12.3 商业 银行 效 据 仓库 建设 面临 哪些 问题 


我 们 可 以 从 四 个 方面 〈 架 构 、 模 型 、 管 理 、 应 用 ) 说 明 一 些 商业 银行 的 数据 仓库 建设 存 
在 哪些 问题 ， 如 图 12-2 Br. 











图 12-2 ”商业 银行 的 数据 仓库 建设 存在 哪些 问题 


淋 构 面临 的 问题 主要 是 数据 链 路 过 长 ， 架 构 的 灵活 性 不 够 ,在 系统 的 可 用 性 上 还 处 于 
较 低 的 水 平 。 对 于 模型 来 说 ， 主 要 问题 是 称 定性 不 够 ， 语 义 层 不 够 丰 军 。 在 管理 方面 ， 主 
要 问题 是 数据 仓库 系统 的 管理 经 验 不 足 。 同 时 ， 在 数据 仓库 基础 上 开发 的 部 门 也 越 来 越 
多 ， 如 何 管 理 跨 部 门 的 使 用 已 经 成 为 了 一 大 难题 。 在 应 用 上 ， 数 据 仓 库 采 用 传统 的 OLTP 
WHF A MATE, ERIR. 

对 于 四 个 方面 的 问题 ， 可 以 提出 相应 的 改进 意见 : 

首先 对 于 架构 的 问题 ， 我 们 可 以 缩短 数据 链 路 ， 通 过 部 普 沙 傅 ， 执 行 一 些 高 可 用 性 的 


万 条 。 
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其 次 ， 对 于 模型 的 问题 ， 我 们 可 以 进行 相应 的 模型 优化 ， 同 时 要 求 数 据 仓 库 的 上 游 系统 
提高 稳定 性 ， 完 善 数据 仓 库 的 语义 层 。 

再 次 ， 对 于 管理 的 问题 ， 我 们 可 以 借鉴 同行 业 先 进 经 验 或 者 国外 经 验 ， 同 时 提升 元 数据 
官 理 系 统 和 数据 质量 官 理 系统 。 你 证 各 个 部 门 之 间 的 定理 和 协作 ， 我 们 也 应 该 制定 相应 的 数 
据 仓 库 开 及 规范 ， 制 定 部 门 接 入 数据 仓库 的 准 入 制度 。 

最 后 对 于 数据 仓库 应 用 上 的 问题 ， 则 应 该 在 开发 方法 和 测试 方法 上 进行 创新 ， 增 强 对 有 灵 
ik Er) ST. 











12.4 ”商业 银行 数据 仓库 建设 思路 及 系统 ' 





青 况 
12.4.1 某 商 业 银 行 建设 数据 仓库 时 遇 到 的 挑战 

商业 银行 建设 数据 仓库 时 遇 到 的 挑战 可 以 从 四 个 方面 说 明 ， 包 括 : 高 可 用 性 、 性 能 / 数 
据 延 迟 性 、 数 据 质量 、 组 织 架构 ， 如 图 12-3 所 示 : 


高 可 
用 性 


数据 质量 


性 能 / 
数据 延迟 性 








图 12-3 ”商业 银行 建设 数据 仓库 时 遇 到 的 挑战 

(1) 高 可 用 性 

缺乏 对 负载 的 管理 ， 造 成 资源 的 相互 和 争夺， 严重 影响 系统 的 可 用 性 。 

(2) 性 能 /数据 延迟 性 

当 多 用 户 使 用 数据 仓库 的 时 候 ， 碍 询 的 并 发 度 是 一 个 很 大 的 挑战 ， 会 造成 性 能 或 者 数据 
的 延迟 性 。 

(3) 数据 质量 

如 果 数 据 仓 库存 在 大 量 不 一 致 和 元 余 的 数据 ， 那 么 对 数据 质量 的 维护 将 是 非常 困难 的 ， 
所 以 我 们 应 该 保证 进入 到 数据 仓库 中 的 数据 都 是 有 用 的 和 清洗 后 的 数据 。 

(4) 组 织 架 构 

对 于 商业 银行 来 说 ， 缺 少 相 关 政策 去 保证 IT 部 门 和 业务 部 门 在 目标 上 是 一 致 的 ， 这 样 
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LAB RIEA G FER EE eR KRA, JP H EM AS NS IE— SX. 
12.4.2” 某 商业 数据 仓库 架构 存在 的 问题 


我 们 可 以 参考 一 下 菏 银 行 的 数据 仓库 架构 ， 分 析 一 下 哪些 地 方 可 以 改进 ， 如 网 12-4 
Bran: 


数据 源 










数据 集 市 
核心 银行 系统 1 


D 
数据 仓库 v^ 

核心 银行 系统 2 
多 


核心 银行 系统 3 


lm i 





图 12-4 东 银 行 的 数据 仓库 如 构 


(1) 现状 

该 银行 每 天 都 将 数据 文件 放 入 到 数据 仓库 中 ， 日 增 量 大 约 有 300 一 400GB 的 数据 ， 如 果 
在 峰值 时 可 能 会 达到 800 一 900GB。 

(2) 需要 优化 的 地 方 

1) 整体 的 数据 架构 都 需要 优化 ， 包 括 : 数据 如 何 迁 移 、 整 体 架 构 缺 少 统一 的 管控 体 
系 ， 同 时 还 面 对 缺 乏 大 数据 的 处 理 机 制 ， 数 据 模 型 没有 统一 规划 等 很 多 问题 。 

2) 因为 在 业务 系统 回 数据 仓库 传送 数据 文件 的 过 程 中 缺少 数据 交换 平台 ， 文 件 被 直接 
送 入 到 仓库 中 ， 中 间 缺 少 绥 冲 区。 这样 意 味 看 在 业务 系统 和 数据 仓库 系统 之 间 人 缺少 了 一 道 屏 
障 。 首 先 因为 仓库 中 主要 存储 的 是 大 量 的 历史 数据 ， 同 时 为 多 个 应 用 提供 服务 ， 所 以 对 于 系 
统 的 效率 来 说 ， 可 能 是 一 个 瓶 贷 。 如 果 它 再 与 多 个 业务 系统 建 并 连接， 这样 会 大 大 降低 仓库 
系统 的 高 效 性 。 其 次 ， 组 冲 区 还 相当 于 数据 进入 到 数据 仓库 系统 的 一 道 闸 门 ， 在 缓冲 区 中 可 
以 完成 清洗 、 合 并 和 校 验 的 工作 ， 保 证 数据 的 一 致 性 和 高 质量 。 最 后 数据 仓库 面 对 的 只 是 组 
冲 区 这 唯一 的 数据 源 ， 由 于 它 把 绥 冲 区 当做 唯一 可 信 的 数据 源 ， 因 此 可 以 大 大 提高 仓库 系统 
的 性 能 。 

3) 该 架构 缺乏 对 库 内 集 市 和 库 外 集 市 的 合理 规划 ， 根 据 性 能 的 要 求 ， 应 用 可 以 分 成 库 
外 和 库 内 的 数据 集 市 ， 分 的 原则 主要 考虑 性 能 的 问题 。 如 果 访 问 量 很 大 ， 就 需要 用 库 外 的 数 
据 集 市 ， 如 果 访 问 量 较 小 ， 束 可 以 考虑 库 内 数据 集 市 。 

我 们 再 来 看 一 下 某 商 业 银 行 的 数据 仓库 逻辑 架构 ， 给 我 们 哪些 提示 ， 如 图 12-5 Drm: 
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图 12-5 EM RAT PSU s FEX RUM 


B: 








CIO 现状 

主机 对 公 系 统 、 个 人 系统 和 开 友 平台 ， 每 天 通过 文件 传输 平台 ， 将 数据 到 ETL 服务 
骼 ， 数 据 经 过 一 系列 的 解压 、 压 缩 后 ， 先 放 到 临时 区 中 ， 该 临时 区 只 存储 一 周 的 数据 ， 是 贴 
数据 源 的 ， 为 后 期 数据 加 工 做 准备 。 

从 临时 区 中 ， 分 成 两 条 路 径 ， 数 据 集成 乎 合 相当 于 ODS 系统 ， 如 果 应 用 是 不 跨 系 统 
的 ， 同 时 要 求 数据 的 时 效 性 较 蜗 ， 则 该 应 用 从 数据 集成 平台 中 取 数 据 。 如 果 该 应 用 要 求 跨 系 
统 取 数据 ， 但 是 要 求 的 时 效 性 不 高 ， 则 该 应 用 从 企业 级 的 数据 仓库 中 取 数 据 。 

对 于 企业 级 的 数据 仓库 来 说 ， 可 以 分 成 基础 层 、 汇 总 层 。 针 对 数据 仓库 的 应 用 可 以 分 成 
库 外 集 市 和 库 内 集 市 ， 诛 则 上 是 需要 考虑 性 能 问题 的 。 当 访问 量 很 大 ， 同 时 要 求 的 时 效 性 
高 ， 则 需要 考虑 库 外 集 市 。 如 采 数 据 的 访问 量 小 ， 可 以 考 碟 使 用 库 内 的 数据 集 市 ， 也 惑 是 在 
仓库 内 做 数据 视图 。 

(2) 需要 优化 的 地 方 

该 商业 银行 的 数据 仓库 好 辑 存在 以 下 儿 个 问题 ， 时 间 窗 口 过 长 ， 数 据 的 链 路 太 长 ， 解 决 
的 办 法 是 通过 主机 连接 到 数据 集成 平 侣 ， 可 以 通过 产品 实现 。 在 时 间 调 度 上 ， 当 东 个 业务 的 
数据 加 载 成 功 之 后 ， 可 以 首先 提供 访问 ， 不 需要 等 全 部 业务 加 载 成 功 之 后 再 提供 数据 访问 。 
在 没有 相互 依赖 的 情况 下 ， 东 个 业务 的 数据 加 载 成 功 之 后 ， 可 以 提供 访问 。 


12.4.3 ”对 该 行 数据 仓库 目标 架构 的 建议 


可 以 对 数据 仓库 的 目标 架构 提供 以 下 建议 ， 如 图 12-6 所 示 : 

1) 在 源 数 据 层 和 服务 层 之 间 建 立 一 个 交换 平台 ， 数 据 服 务 层 内 部 的 数据 流动 都 通过 交 
痪 平台 ，ODS 存储 的 都 是 实时 性 的 数据 ， 数 据 仓库 存储 的 都 是 历史 数据 。 

2) 数据 仓库 可 以 分 成 基础 层 、 汇 总 层 和 库 内 数据 集 市 。 

3) 对 数据 沙盘 的 使 用 ， 如 果 某 个 应 用 从 数据 源 层 通过 交换 平台 到 ODS， 再 到 数据 仓库 
层 、 数 据 集 市 层 ， 可 能 数据 的 链 路 过 长 ， 影 响应 用 的 时 效 性 。 通 过 建立 一 个 数据 沙盘 ， 这 样 
数据 可 以 直接 从 ODS 取 数 据 ， 或 者 从 数据 仓库 、 数 据 集 市 中 取出 数据 ， 数 据 沙盘 可 以 看 作 
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是 数据 试验 区 。 
源 数据 层 。 数据 交换 平台 数据 服务 层 应 用 层 
结构 化 数据 
- 


大 数据 ( 非 结构 化 数据 ) 
非 结构 化 数据 
inl uii i 


图 12-6 数据 仓库 的 目标 架构 











4) 对 于 大 数据 来 说 ， 本 里 可 能 会 有 应 用 ， 或 者 和 结构 化 数据 结合 起 来 应 用 。 

5) 所 有 的 数据 流动 都 统一 调度 。 对 数据 的 分 布 和 流转 进行 管控 ， 包 括 元 数据 管理 、 数 
据 标 准 管理 、 数 据 质量 管理 、 数 据 的 生命 周期 管理 。 
总 结 : 

数据 仓库 架构 中 ， 包 括 数 据 源 层 、 数 据 交 换 平 台 、 数 据 服务 屋 、 应 用 层 。 

数据 源 层 为 各 OLTP 生产 系统 ， 例 如 一 些 核心 业务 系统 等 ， 对 时 效 性 要 求 局 。 作 为 数据 
仓库 的 主要 数据 来 源 ， 数 据 源 层 还 可 能 包括 文件 系统 、Web 等 非 传统 的 非 结 构 化 数据 。 

数据 服务 层 主要 包含 数据 仓库 ， 通 过 细 市 数据 存储 、 沪 总 数据 加 工 等 方式 ， 将 ETL 加 
载 的 数据 进行 加 工 处 理 ， 文 持 后 续 应 用 。 数 据 服 务 层 结合 业务 的 需要 可 以 设计 成 库 内 集 市 或 
库 外 集 市 。 

应 用 层 对 数据 服务 层 加 工 出 的 数据 ， 通 过 毅 态 报表 、 动 态 OLAP 处 理 等 方式 提供 给 
Hr. 


12.5 商业 银行 效 据 仓库 建 设 局 示 


对 于 大 多 数 商 业 银行 来 将， 数据 仓库 的 建设 不 是 一 路 而 就 的 ， 而 是 分 阶段 实施 的 ， 然 后 
再 逐步 建设 和 完善 数据 仓库 模型 ， 最 后 对 应 用 形成 文 持 。 

在 数据 仓库 的 建设 过 程 中 ， 需 要 业务 部 门 深 入 参与 ， 欣 掘 和 分 析 业 务 方面 的 需求 ， 同 时 
建立 相应 的 数据 管控 。 如 网 12-7 所 示 : 首先 尼 动 数据 仓库 的 建设 ， 业 务 部 门 参与 需求 分 
析 ， 然 后 再 将 数据 仓库 的 建设 和 数据 管控 的 工作 结合 起 来 ， 最 后 再 分 阶段 的 进行 建设 。 

1. 根据 业务 运营 、 客 尸 关系 管理 和 决策 分 析 等 需求 ， 局 动 效 据 仓库 项 目的 建设 

很 多 商业 银行 为 了 满足 例如 风险 管理 或 者 监管 合 规 等 方面 的 需求 ， 司 动 企 业 级 数据 仓库 
的 建设 。 一 般 在 业务 数据 量 相 对 较 小 的 时 候 局 动 数据 仓库 项 目的 建设 ， 降 低 系 统 建 设 的 难度 
和 风险 。 
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* 分 阶段 开展 建设 ,注重 团队 培养 







* 数据 仓库 建设 与 数据 管控 工作 相辅相成 


* 业务 部 门 主导 及 深入 参与 


“启动 数据 仓库 建设 
图 12-7 数据 仓库 的 建设 过 程 


2. 仓库 的 建设 需要 业务 人 员 广 泛 参 与 

对 于 商业 银行 来 说 ， 数 据 仓库 的 建设 需要 业务 部 门 的 广泛 参与 、 深 入 挖掘 和 分 析 业 务 需 
求 ， 从 而 指导 数据 仓库 模型 的 设计 。 数 据 的 集中 过 程 需要 业务 部 门 的 参与 ， 包 括 数据 的 请 洗 
和 整合 过 程 ， 在 此 基础 上 ， 深 入 欣 据 信息 和 知识 ， 发 挥 数据 仓库 的 价值 。 

3. 数据 仓库 建设 与 数据 管控 工作 相 辅 相 太 

对 于 商业 银行 来 说 ， 数 据 标 准 建设 为 数据 仓库 提供 统一 的 定义 ， 它 是 数据 仓库 的 重要 基 
人 而。 如 来 先进 行 数 据 仓库 的 建设 ， 后 期 再 进行 数据 标准 的 建设 ， 会 对 仓库 的 建设 带 来 一 定 的 
影响 。 数 据 仓 库 的 建设 需要 将 数据 管控 结合 起 来 ， 这 样 会 提升 数据 仓库 的 质量 ， 从 而 你 障 数 
据 的 可 信和 度 。 

4. 分 阶段 开展 建设 ， 注 重 团队 培养 

国内 的 商业 银行 一 般 是 分 阶段 的 建设 数据 仓库 ， 而 数据 仓库 项 目 复杂 度 相 对 较 局 ， 需 要 
丰富 的 专业 知识 和 技能 ， 这 就 需要 对 数据 仓库 方面 的 人 才 进 行 声 养 。 























12.0 本章 小 结 
1) 商业 银行 建设 数据 仓库 时 遇 到 的 挑 成 : 高 可 用 性 、 性 能 /数据 延迟 性 、 数 据 质 量 、 组 


2) 对 于 大 多 数 商 业 银 行 来 说 ， 数 据 仓 库 的 建设 不 是 一 践 而 残 的 ， 而 是 分 阶段 实施 的 ， 
然后 再 逐步 建设 和 完善 数据 仓库 模型 ， 最 后 对 应 用 形成 文 持 。 

3) 在 数据 仓库 的 建设 过 程 中 ， 需 要 业务 部 门 深 入 参与 ， 挖 据 和 分 析 业 务 方面 的 需求 ， 
同时 建立 相应 的 数据 管控 。 
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95 135€ 电力 行业 数据 仓库 的 建设 规划 


本 章 目标 

FASE, KKE: 

e :87JA TN UG E EE o 

e 电力 行业 数据 仓库 逻辑 染 构 。 

e 电力 行业 数据 仓库 能 力 贤 图 。 

e 数据 仓库 促进 电力 业务 的 发 展 。 
e 数据 仓库 建设 策略 。 

e 电力 行业 数据 仓库 模型 建立 过 程 。 
e 电力 行业 数据 仓库 的 架构 设计 。 


13.1 电力 行业 数据 仓库 建设 难 扣 


电力 行业 数据 仓库 的 建设 存在 以 下 难 点 《如 图 13-1 所 示 ): 

首先 ， 在 电力 行业 里 ， 无 论 是 总 部 还 是 下 级 单位 ， 普 过 都 缺乏 统一 的 数据 规划 ， 包 括 没 
有 标准 化 的 数据 模型 ， 缺 乏 统一 的 编 但 管理 ， 对 数据 质量 问题 缺乏 重视 等 问题 。 

其 次 ， 缺 乏 仓 库 建 设 在 试点 单位 的 验证 过 程 ， 因 为 各 个 单位 都 采取 各 目 为 政 的 建设 方 
式 ， 很 容易 形成 信息 孤岛 ， 导 化 数据 的 不 完整 性 。 最 后 造成 数据 集成 的 成 本 越 来 越 融 ， 而 数 
据 分 析 可 信和 度 不 断 降低 。 














缺乏 统一 的 数据 规划 

对 数据 质量 问题 缺乏 重视 

缺乏 数据 仓库 建设 在 试点 单位 的 验证 
缺乏 对 数据 仓库 建 模 的 具体 指导 意见 
数据 不 统一 、 不 完整 、 不 准确 

成 功 的 经 验 无 法 得 到 有 效 的 推广 





图 13-1 电力 行业 数据 仓库 建设 难点 
解决 难点 的 方法 : 
解决 数据 仓库 建设 难点 有 以 下 儿 种 方法 : 
可 以 通过 试点 建设 积累 经 验 ， 形 成 统一 的 数据 模型 标准 、 管 控 方 法 和 流程 ， 然 后 再 大 面 
积 地 推广 。 如 图 13-2 所 示 : 
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试点 的 建设 ”| ARRA 
CO 
~ ea -— 贯彻 推广 
CURE 


13-2. 解决 数据 仓库 建设 难 扣 的 方法 


13.2 电力 行业 数据 仓库 逻辑 染 构 


应 用 分 析 通 过 数据 仓库 和 焦 市 提供 支持 ， 并 日 通过 展示 层 将 分 析 的 结果 展示 给 用 户 ， 如 
图 13-3 所 示 : 














= 





前 端 展 示 层 


数据 应 用 层 


数据 集 市 层 








业务 数据 和 其 他 外 部 数据 i 


图 13-3 ”电力 行业 数据 仓库 逻辑 架构 


13.3 ”电力 行业 数据 仓库 能 力 监 图 


电力 行业 数据 仓库 应 该 具备 以 下 儿 种 能 力 如 图 13-4 所 示 ): 





集中 整合 
数据 按照 业务 主题 的 方式 进行 存储 ， 完 成 对 分 散 数据 的 整合 工作 ， 形 成 “唯一 数据 
分 析 展 现 





通过 分 析 展 现 帮助 浓 理 人 员 做 出 正确 分 析 和 决策 ， 针 对 具体 应 用 建立 集 市 ， 并 且 提 供 融 
效 的 数据 但 询 和 服务 。 
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数据 移动 分 析 展 现 


电力 行业 数据 仓库 


应 该 具备 的 能 


质量 保障 





图 13-4 ”电力 行业 数据 仓库 应 该 其 备 的 儿 种 能 


高 级 应 用 
为 管理 人 员 提 供 多 维 分 析 的 能 力 ， 帮 助 用 户 从 多 个 维度 深入 分 析 指 标 ， 同 时 也 应 该 具备 
数据 挖掘 的 能 力 ， 对 企业 的 状况 和 未 来 发 展 做 出 完整 、 合 理 的 预测 。 
KB 
应 该 具备 强大 的 元 数据 管理 功能 ， 实 现 各 类 技术 本 语 和 业务 本 语 的 统一 定义 。 
质量 保障 
数据 仓库 应 该 具备 数据 质量 管理 机 制 ， 以 保障 数据 的 一 致 性 与 准确 性 。 


数据 移动 
提供 数据 抽取 、 转 换 与 加 载 的 能 力 。 可 以 高 效 地 将 数据 移 到 数据 仓库 中 。 


13.4 ”数据 仓库 促进 电力 业务 的 发 展 


数据 仓库 可 以 促进 电力 业务 的 发 展 ， 如 图 13-5 所 示 : 











业务 人 员 决策 领导 
^ 


提高 电力 安全 运营 能 力 提高 绩效 分 析 能 力 


提高 电力 营销 管理 能 力 提高 决策 分 析 的 能 力 





图 13-5 数据 仓库 促进 电力 业务 的 发 展 
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数据 仓库 的 建设 可 以 提高 电力 安全 运营 、 绩 效 分 析 、 电 力 营销 管理 和 决策 分 析 的 能 
其 体 表现 是 通过 对 电力 设备 的 运行 状况 、 检 修 和 事故 的 及 时 苔 握 ， 提 高 安全 运 介 的 能 力 。 通 
过 对 电量 、 电 费 、 电 价 的 分 析 ， 拓 局 对 电量 的 需求 预测 能 力 和 价格 制定 能 力 ， 这 样 可 以 大 大 
提高 电力 营销 管理 的 能 力 。 数 据 仓库 可 以 为 分 机 人 员 提 供 全 面 的 关键 业务 信息 。 


人 .5 数据 仓库 建设 案 略 比较 


第 一 种 数据 仓库 建设 策略 : 

由 业务 部 门 建立 各 目的 数据 集 市 ， 这 种 方式 有 可 能 会 造成 ETL 的 重复 开 及 ， 导 致 缺少 
统一 的 规划 和 协调 ， 千 成 资源 的 浪 绩 。 因 为 缺少 跨 业 务 系统 数据 的 支撑 ， 所 以 无 法 提供 全 面 
的 分 析 能 力 。 这 种 策略 的 优点 是 设计 和 开发 的 时 间 周 期 相对 较 短 。 

第 二 种 数据 仓库 建设 策略 : 

由 业务 部 门 根据 目 身 的 需求 ， 在 统一 数据 仓库 平台 上 建设 分 析 应 用 ， 这 种 建设 方式 可 以 
生成 全 企业 的 统一 信息 视图 ， 提 供 更 全 面 的 分 析 能 力 。 同 时 可 以 建设 统一 的 数据 管理 机 制 ， 
提升 数据 质量 。 但 是 因为 设计 、 开 发 的 难度 较 大 ， 时 间 周 期 也 相对 较 长 。 


13.6 电力 行业 数据 仓库 模型 建立 过 程 


电力 行业 数据 仓库 模型 的 建设 过 程 如 图 13-6 所 示 : 先 建设 企业 级 的 概念 模型 ， 然 后 在 
此 基础 上 建设 逻辑 数据 模型 ， 最 后 建设 物理 数据 模型 。 


概念 数据 模型 逻辑 数据 模型 物理 数据 模型 
O — cul NEN —— — 


















































企业 级 概念 数据 模型 企业 级 逻辑 数据 模型 物理 数据 模型 





图 13-6 电力 行业 数据 仓库 模型 的 建设 过 程 
13.7 电力 行业 数据 仓库 的 染 构 设计 


电力 行业 数据 仓库 的 架构 设计 如 图 1377 所 示 : 

1) 总 部 ODS 的 组 成 和 省 级 单位 的 ODS 相同 ， 主 要 区 别 在 于 数据 源 的 不 同 ， 总 音 
ODS 的 数据 源 来 目 于 总 部 业务 系统 ， 而 省 级 单位 ODS 主要 数据 源 来 目 于 省 级 单位 的 业务 
系统 。 

2) 总 部 数据 仓库 的 数据 来 源 包 括 业 务 明细 数据 和 汇总 数据 ， 和 省 电力 数据 仓库 的 数据 是 
以 中 度 或 高 度 汇 总 的 数据 进行 存放 的 。 

3) 电力 总 部 的 数据 集 市 主要 针对 公司 整体 发 展 分 机 ， 路 系统 和 路 省 地 对 效 据 进 行 全 面 
ZTE o 
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pon m ODS E 数据 仓库 ”ee 数据 集 市 


$7.1.  -— Oops  m-P 
省 级 数据 仓库 web idem 


地 市 业务 数据 -—-—— 缓冲 区 my "T 


图 13-7 “电力 行业 数据 仓库 的 架构 设计 


4) 省 电力 公司 的 数据 仓库 主要 上 履 盖 多 个 主题 域 的 信息 ， 这 些 信息 是 低级 别 的 、 细 粒度 
数据 ， 同 时 根据 分 析 需 求 建立 一 定 粒 度 的 汇总 数据 。 它 们 主要 为 数据 集 市 提供 整合 后 的 、 高 
质量 的 数据 。 省 级 数据 仓库 和 总 部 数据 仓库 存在 数据 交换 的 功能 ， 同 时 将 一 部 分 数据 下 发 到 
地 市 级 中 。 

5) 省 级 电力 公司 的 数据 集 市 是 一 组 特定 的 、 针 对 某 个 主题 域 或 部 门 的 数据 集合 。 它 可 
以 保障 数据 仓库 的 高 可 用 性 、 可 扩展 性 和 高 性 能 。 

数据 移动 说 阴 : 

(12 ODS 绥 冲 区 抽取 到 数据 仓库 区 (如 图 13-8 所 示 ) 

数据 仓库 区 是 最 核心 的 数据 存储 区 域 ， 它 支持 大 部 分 的 数据 应 用 。 

数据 仓库 内 的 数据 按照 面向 主题 的 方式 进行 组 织 和 存放 。 数 据 模型 满足 第 三 范式 ， 这 些 
数据 存储 的 周期 一 般 较 长 ， 而 ODS 缓冲 区 中 的 数据 结构 和 业务 系统 相似 ， 乞 起 到 缓冲 的 作 
Hj. A ODS 缓冲 区 ， 数 据 经 过 转换 、 映 射 、 清 洗 ， 最 后 加 载 到 数据 仓库 区 中 。 中 间 的 过 程 
包含 了 人 合并、 匹配 、 数 据 的 追加 《〈 履 盖 、 更 新 ) 等 操作 。 






































ODS 缓冲 区 





数据 仓库 区 











图 13-8 ODS 缓冲 区 抽取 到 数据 仓库 区 


(2) 数据 仓库 到 数据 集 市 的 抽取 如 图 13-9 所 示 ) 
数据 集 市 是 针对 某 个 主题 域 或 部 门 的 数据 集合 。 集 市 的 数据 模型 可 以 是 星 形 结构 或 雪 
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化 形 结构 ， 而 数据 仓库 的 数据 模型 满足 第 三 范式 。 从 数据 仓库 到 数据 集 市 的 数据 了 迁移， 包 
括 实 体 表 和 事实 表 、 维 表 之 间 的 映射 关系 以 及 转化 过 程 ， 其 主要 过 程 包 含 了 汇总 、 绥 慢 变 
化 维 等 操作 。 











数据 仓库 区 E 
产品 
"HET 


图 13-9 数据 仓库 到 数据 集 市 的 抽取 


(3) 总 部 数据 仓 库 和 省 数据 仓库 之 间 的 数据 交换 《“ 如 网 13-10 所 示 ) 

总 部 数据 仓库 的 数据 源 主 要 包含 两 部 分 的 内 容 : 一 部 分 是 忆 部 的 业务 数据 ， 为 外 一 部 分 
是 省 电力 公司 数据 仓库 的 数据 。 和 省 电力 公司 定时 间 总 部 数据 仓库 上 传 数据 以 供 分 析 使 用 ， 同 
时 总 部 数据 仓库 也 会 定期 将 汇总 的 数据 下 发 到 省 电力 公司 。 

一 般 来 次 ， 总 部 的 数据 仓库 只 抽取 部 分 省 电力 公司 的 数据 ， 存 储 路 系统 、 高 度 汇 总 和 集 
成 的 数据 。 





总 部 数据 仓库 区 省 数据 仓库 区 
Ls 
XH H 设备 设备 


图 13-10 总 部 数据 仓库 和 省 数据 仓库 之 间 的 数据 交换 


(4) 省 数据 仓库 和 地 市 综合 数据 库 的 数据 交换 (如 图 13-11 所 示 ) 
省 电力 数据 仓库 会 定期 将 相关 数据 加 载 到 地 市 综合 数据 库 ， 对 于 地 市 综合 数据 库 来 说 ， 
它 的 数据 主要 来 源 于 省 级 数据 仓库 下 发 的 数据 和 部 普 在 地 市 级 别 的 业务 系统 数据 。 





13.8 kx 


1) 电力 行业 数据 仓库 的 建设 存在 以 下 难点 : 

e 首先 ， 在 电力 行业 里 ， 无 论 是 总 部 还 是 下 级 所 属 单位 ， 普 过 都 缺乏 统一 的 数据 规划 ， 包 
括 没有 标准 化 的 数据 模型 ， 缺 乏 统一 的 编码 管理 ， 对 数据 质量 问题 缺乏 重视 等 问题 。 

e 有 其次， 缺乏 仓库 建设 在 试点 单位 的 验证 过 程 ， 因 为 各 个 单位 都 采取 各 目 为 政 的 建设 方 
式 ， 很 容易 形成 信息 扳 号 ， 导 致 数据 的 不 完整 性 。 最 后 造成 数据 集成 的 成 本 越 来 越 
高 ， 而 数据 分 析 可 信和 度 不 断 降低 。 
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总 部 数据 仓库 区 





地 市 综合 数据 库 


SB 5o PR 
项 资 设备 
13-11 省 数据 仓库 和 地 市 综合 数据 库 的 数据 交换 


2) 解决 数据 仓库 建设 难点 有 以 下 儿 种 方法 : 
可 以 通过 试点 建设 积累 经 验 ， 形 成 统一 的 数据 模型 标准 、 管 控 方 法 和 流程 ， 然 后 再 大 面 





积 地 推广 。 

3) 电力 行业 数据 仓库 应 该 具备 以 下 儿 种 能 力 : 集中 整合 、 分 析 展 现 、 遍 级 应 用 、 信 县 
描述 、 质 量 保 隐 、 数 据 移动 。 

4) 数据 仓库 的 建设 可 以 提高 电力 安全 运营 、 绩 效 分 析 、 电 力 营销 管理 和 决策 分 析 的 能 

5) 电力 行业 数据 仓库 模型 的 建设 过 程 : 先 建设 企业 级 的 概念 模型 ， 然 后 在 此 基础 上 建 
设 逻 辑 数 据 模 型 ， 最 后 建设 物理 数据 模型 。 
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第 14 革 -商业 智能 项 目 规划 和 定理 


本 章 目标 

本 章 内 容 主要 包括 商业 智能 项 目 团队 的 组 织 结构 ， 项 目 角 色 的 划分 及 技能 要 求 ， 如 何 定 
义 领 导 组 的 职责 和 主要 任务 ， 商 业 智 能 项 目的 进度 ， 以 及 如 何 定义 商业 智能 项 目的 过 程 等 
容 。 在 本 章 中 ， 您 可 以 充当 项 目 领导 者 的 角色 ， 学 会 如 何 实施 商业 智能 项 目 和 如 何 对 项 目 进 
行 细致 的 规划 和 管理 。 

FASE., KKE: 

e 商业 智能 项 目 团队 的 组 织 结构 。 
项 目 角色 划分 及 技能 要 求 。 
领导 组 的 职责 和 主要 任务 。 
如 何 定 义 商 业 智 能 项 目的 进度 。 
如 何 定 义 商 业 智 能 项 目的 过 程 。 

















141 项 目 团 队 的 组 织 结构 





商业 智能 项 目 团队 通常 分 成 以 下 角色 : 项 目 经 理 、 业 务 顾问 、 数 据 模 型 架构 师 、ETL I. 
程 师 、 报 表 展 示 工 程 师 、DBA、 最 终 用 户 。 
商业 智能 项 目 团队 的 组 织 结构 如 图 14-1 所 示 。 


e 
AM. 


数据 模型 架构 师 















业务 顾问 





ETL 工 程 师 


报表 展示 工程 师 
图 14-1 项 目 团队 的 组 织 结构 
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商业 智能 项 目 团队 中 的 角色 及 其 职责 见 表 14-1。 


表 14-1 商业 智能 项 目 团队 中 的 角色 及 其 职责 


Ao E 职 
主要 负责 项 目 评 审 和 需求 分 析 的 工作 ， 适 时 参与 概念 模型 、 逻 辑 模 型 的 设计 。 负 责 监 督 项 目的 整体 流程 


E 


WHAE | 和 工作 进度 ， 包 括 后 期 维护 工作 的 安排 等 内 容 

业务 顾问 负责 需求 分 析 工 作 、 概 念 模型 和 风 辑 模型 的 设计 工作 
数据 模型 架构 师 | 。 负责 概念 模型 、 罗 辑 模 型 和 物理 模型 的 设计 工作 
ETL 工程 师 负责 数据 的 抽取 、 清 洗 、 转 换 和 加 载 
报表 展示 工程 师 | ”负责 报表 的 设计 和 开发 

DBA 负责 数据 库存 信和 管理 

最 终 用 户 参与 项 目的 评审 ， 需 求 分 析 等 工作 


商业 智能 项 目的 流程 如 图 14-2 所 示 ， 主 要 包括 以 下 步骤 : 项 目的 局 动 、 需 求 定义 、 系 
统 设计 、 系 统 的 开发 和 实现 、 项 目的 实施 和 部 车 、 系 统 的 测试 和 上 线 试 运行 ， 最 后 是 系统 的 


优化 和 正式 上 线 。 
[amne Jo arer | 中 | mm 


系统 设计 
SU 


项 目的 实施 和 人 系统 的 开发 和 
HE 实现 





系统 的 优化 和 
IEX EZ 


图 14-2 商业 智能 项 目的 流程 


14.2. 项 目 角色 划分 及 技能 要 求 


项 目 角色 划分 及 技能 要 求 见 表 14-2。 


表 14-2 项 目 角色 划分 及 技能 要 求 


HH ff fé 技能 要 求 
具备 一 年 以 上 的 项 目 经 理工 作 经 验 、 一 定 的 项 目 实施 和 开发 经 验 ， 掌 握 该 项 目的 业务 知识 ， 共 有 软件 








项 目 经 " 2 M M iW 

A HERE 工程 的 思想 ， 熟 悉 项 目 管理 和 商业 智能 理论 方面 的 知识 

9€ 了 解 该 项 目的 业务 知识 ， 具 备 良 好 的 沟通 和 表达 能 力 ， 有 相应 的 技术 能 力 ， 具 备 需求 分 析 和 需求 管理 
m i: 的 经 验 ， 对 商业 智能 的 整体 架构 思想 有 一 定 的 认识 

具备 一 定 的 架构 和 设计 经 验 ， 了 解 该 项 目的 业务 知识 ， 精 通 软件 架构 理论 和 设计 工具 的 使 用 ， 掌 握 建 


模 知识 和 数据 库 设 计 ， 敦 悉数 据 仓库 理论 和 商业 智能 的 整体 架构 思想 
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项 目 角色 技能 要 求 
开发 人 员 具备 一 定 的 软件 编程 经 验 ， 掌 握 完整 的 数据 仓库 理论 知识 和 数据 仓库 开发 经 验 ， 具 备 商业 智能 的 整体 








架构 思想 ， 有 ETL 设计 开发 和 报表 设计 开发 经 验 ， 掌 握 数 据 库 方面 的 知识 


具备 该 项 目的 业务 知识 ， 熟 悉 软 件 的 测试 方法 ， 具 备 一 定 的 质量 管理 方面 的 理论 知识 ， 熟 悉 丙 业 智 能 


WAS 的 整体 架构 思想 
实施 维护 人 员 了 解 该 项 目的 业务 知识 ， 熟 悉 商 业 智 能 的 整体 架构 思想 ， 具 备 一 定 的 问题 解决 能 力 和 判断 能 


14.8 ”定义 领导 组 的 职责 和 主要 任务 


























领导 组 成 员 的 主要 职责 就 是 确定 工作 的 目标 、 评 审 工 作 的 结果 和 确定 不 同 岗位 的 主要 负 
页 人 人。 项目 领导 组 的 主要 任务 包括 : 确定 公司 对 项 目的 进度 安排 、 工 作 的 主要 方法 ， 验 收 审 
核 项 目 各 个 阶段 的 不 同 成 果 等 内 容 。 在 商业 智能 项 目 开 发 过 程 中 ， 需 要 制定 项 目的 各 种 管理 
规范 和 规章 制度 ， 确 定 项 目 组 人 员 的 岗位 和 职责 ， 规 范 各 种 开发 文档 ， 监 督 项 目的 执行 情 
况 。 具 体 如 图 14-3 所 示 。 


























领导 组 的 职员 和 主要 任务 





。 确定 工作 的 目标 、 评 审 工作 的 结 末 
。 确 定 不 同 岗位 的 主要 负责 人 
e 确定 公司 对 项 目的 进度 安排 、 工 作 


的 主要 方法 

。 验 收 审核 项 目 各 个 阶段 的 不 同 成 果 
。 制 定 项 目的 管理 规范 和 规章 制度 
。 规 范 各 种 开发 文档 ， 监 督 项 目的 执 
行情 况 








图 14-3 ”领导 组 的 职责 和 主要 任务 
14.4 ”如 何 定义 两 业 智 能 项 目的 进度 


制订 商业 智能 项 目 进度 计划 的 方法 有 两 种 。 

D) 定义 项 目的 任务 ， 任 务 的 开始 时 间 、 结 束 时 间 、 所 需要 有 的 资源 等 信息 。 例 如 ， 将 商 
业 智 能 项 目 分 成 以 下 几 个 阶段 : 对 现 有 系统 的 分 析 、 调 研 ， 概 念 模型 的 设计 、 提 交 ， 人 逻辑 模 
型 的 设计 、 提 交 ， 物 理 模 型 的 设计 、 提 交 ，ETL 的 设计 与 开发 ， 报 表 展 示 的 设计 与 开发 ， 
见 表 14-3. 











表 14-3 商业 智能 项 目的 进度 计划 


阶段 任务 的 结束 时 间 其 他 
ARANA W 
概念 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 和 调研 人 员 
逻辑 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 和 调研 人 员 
物理 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 
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^ R 任务 的 开始 时 间 | 任务 的 结束 时 间 所 需要 的 资源 其 他 
ETL 的 设计 与 开发 ETL 设计 人 员 和 开发 人 员 
报表 展示 的 设计 与 开发 报表 展示 设计 人 员 和 开发 人 员 


2) 根据 项 目的 不 同 阶段 可 以 分 成 :需求 定义 阶段 、 设 计 阶 段 、 实 现 阶段 、 测 试 阶段 、 
发 布 阶段 、 实 施 部 著 阶 段 、 项 目 验 收 阶 段 ， 见 表 14-4. 





表 14-4 商业 智能 项 目的 不 同 阶段 
Wo R 任务 的 开始 时 间 | 任务 的 结束 时 间 工作 成 果 


E >s H H Ea 
需求 定义 阶段 需求 分 析 整 理 2011.6.1 2011.8.1 m P dd mok Ut 
商业 智能 项 目的 概要 设 
设计 阶段 计 、 详 细 设 计 、ETL 设计 、 2011.8.1 2011.10.1 提交 设计 说 明 书 
报表 设计 


单元 测试 、 集 成 测试 、 用 提交 集成 测试 
测试 阶段 TRUM 2012.1 2012.5.1 
则 试 除 段 户 测试 Hus 


实施 部 署 阶段 系统 部 署 、 优 化 2012.6.1 2012.7.1 |J 


页 JV. JT EX ` ` Z ele 0O. 签字 
项 目 验 收 阶段 户 根据 合同 进行 验收 2012.7.1 2012.8.1 m 用 户 确 认 签 字 


14.9 ”如 何 定 义 丙 业 智 能 项 目的 过 程 























商业 智能 项 目的 过 程 一 般 包 括 以 下 几 个 部 分 ， 需求 开发 、 商 业 智能 项 目的 开发 计划 、 商 
业 智 能 项 目的 设计 、 商 业 智能 项 目的 实现 过 程 、 商 业 智能 项 目的 测试 、 商 业 智能 项 目的 实施 
和 发 布 、 商 业 智 能 项 目的 验收 ， 如 网 14-4 所 示 。 
















商业 智 El 能 
项 目的 验收 











商业 智 El 能 
项 目的 
测试 


商业 管 El HE 
项 目的 实现 
过 程 


图 14-4 商业 智能 项 目的 过 程 
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D 需求 开发 ， 包括 制订 需求 开发 计划 、 根 据 调研 结果 进行 需求 整理 。 成 果 包括 需求 计 
划 说 明 书 、 用 户 需求 说 明 书 、 软 件 需求 说 明 书 等 。 

2) 商业 智能 项 目的 开发 计划 : 包括 对 商业 智能 项 目的 估算 、 制 订 商业 智能 项 目的 计 
划 、 项 目的 需求 计划 变更 等 内 容 。 成 果 包 括 商业 智能 项 目的 计划 书 、 项 目 计 划 评 审 书 、 项 目 
配置 管理 说 明 书 、 项 目 风险 管理 计划 说 明 书 等 。 

3) 商业 智能 项 目的 设计 : 包括 商业 智能 项 目 概要 设计 、 商 业 智 能 项 目 详细 设计 、ETL 
设计 、 报 表 设计 等 内 容 。 成 果 包 括 商业 智能 项 目 概要 设计 说 明 书 ， 详 细 设计 说 明 书 、ETL 设 
计 说 明 书 、 报 表 设 计 说 明 书 、 数 据 库 设计 说 明 书 等 。 

4) 商业 智能 项 目的 实现 过 程 : 包括 代码 的 编号、ETL 的 开发 、 报 表 的 开发 、 单 元 测 
试 等 内 容 。 成 果 包括 项 目的 源 代 码 、 代 码 抽查 记录 、 程 序 的 清单 、 用 户 的 手册 、 单 元 测试 
记录 等 。 

s) 商业 智能 项 目的 测试 : 包括 项 目的 集成 测试 、 用 户 测试 等 内 容 。 成 果 包 括 商业 智能 
项 目 集成 测试 计划 说 明 书 、 集 成 测试 的 用 例 、 集 成 测试 的 结果 报告 等 。 

6) 商业 智能 项 目的 实施 和 发 布 ; 包括 系统 的 发 布 、 产 品 的 实施 、 用 户 的 培训 、 日 常 问 
题 的 处 理 等 内 容 。 成 果 包 括 项 目 实施 计划 说 明 书 、 实 施 评审 结果 记录 、 系 统 安装 的 配置 说 明 
书 、 系 统 日 常 维护 说 明 书 、 系 统 生产 环境 说 明 书 、 用 户 培训 说 明 书 等 。 

7) 商业 智能 项 目的 验收 ;主要 成 果 包 括 项 目 验收 报告 等 。 





















































14.0 kx (M 


10 商业 智能 项 目 团队 通常 分 成 以 下 角色 : 项 目 经 理 、 业 务 顾问 、 数 据 模 型 架构 师 、 
ETL 工程 师 、 报 表 展 示 工 程 师 、DBA、 最 终 用 户 。 

2) 项 目 领导 组 的 主要 任务 包括 : 确定 公司 对 项 目的 进度 安排 、 工 作 的 主要 方法 ， 验 收 
审核 项 目 各 个 阶段 的 不 同 成 果 等 内 容 。 

3) 制订 商业 智能 项 目的 进度 计划 有 两 种 方法 : 也 定义 项 目的 任务 ， 任 务 的 开始 时 间 、 
结束 时 间 、 上 所 需要 的 资源 等 信息 。 凶 根据 项 目的 不 同 阶段 可 以 分 成 : 需求 定义 阶段 、 设 计 阶 
段 、 实 现 阶段 、 测 试 阶 段 、 发 布 阶段 、 实 施 部 普 阶 段 、 项 目 验 收 阶 段 。 

4) 商业 智能 项 目的 过 程 一 般 包 括 以 下 几 个 部 分 : 需求 开发 、 商 业 智 能 项 目的 开发 计 
划 、 商 业 智 能 项 目的 设计 、 商 业 智 能 项 目的 实现 过 程 、 丙 业 智 能 项 目的 测试 、 丙 业 智 能 项 月 
的 实施 和 发 布 、 商 业 智 能 项 目的 验收 。 
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H15% 商 业 智 能 应 用 介绍 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 疝 业 智能 应 用 设计 的 原则 。 
和 业 智 能 应 用 的 实施 步骤 。 
nlt 具有 的 应 用 功能 
商业 应 用 实例 。 





mE 1 








Ej ER Ex Oz 
TA 
uw ap ap amb 
CO CE CC 





d 





| 


19.1.— rali Be Ir FR B En DU 


商业 智能 应 用 设计 应 该 遵循 以 下 几 个 原则 ， 如 图 15-1 所 示 : 


ra) 


中 





D} 





实 
用 
性 
和 
可 
操 
fE 
性 





图 15-1 商业 知 能 应 用 设计 的 原则 


ideis 
业 智 能 的 建立 应 该 采用 先进 的 管理 和 开发 经 验 ， 除 了 满足 当前 的 需要 ， 同 时 也 应 该 具 
(2) 实用 性 和 可 操作 性 
首先 选择 重要 的 和 见效 快 的 需求 作为 主要 的 建设 方向 。 保 障 商业 智能 的 应 用 可 以 尽快 帝 
来 实际 效益 ， 使 得 商业 智能 具有 实用 性 和 可 操作 性 。 
可 信人 性 
业 智 能 系统 应 该 具有 高 度 的 可 信 性 ， 包 括 在 异常 情况 发 生 时 的 处 理 和 恢复 机 制 。 
: 安全 性 
业 智 能 系统 应 该 保 隧 数据 的 机 密 性 和 安全 性 。 
B 昂 用 性 
商业 智能 展示 的 数据 应 该 通过 合理 的 ETL 设计 ， 保 障 数据 的 准确 性 和 易 懂 性 ， 以 增加 
业 智 能 的 多 用 性 。 
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需求 分 析 
数据 仓库 建 模 
商业 智能 应 用 的 数据 抽取 
实施 步 又 
建立 分 析 报表 
对 于 系统 的 改进 和 完善 





15-2. 商业 智能 应 用 的 实施 步 又 


(1 ) 需求 分 析 

首先 应 该 明确 企业 对 商业 智能 的 期 望 和 具体 需求 。 

(2) 数据 仓库 建 模 

通过 对 需求 的 分 析 ， 建 立 企业 级 数据 仓库 的 逻辑 模型 和 物理 模型 ， 将 企业 各 类 数据 按照 
主题 进行 组 织 和 归 类 。 

(3) 数据 抽取 

数据 从 业务 系统 抽取 到 数据 仓库 的 过 程 是 将 不 同 数据 源 的 数据 进行 抽取 、 清 洗 、 转 换 和 
装载 ， 最 后 导入 到 数据 仓库 中 。 

(4) 建立 分 析 报 表 

商业 智能 分 析 报 表 可 以 根据 用 户 不 同 的 需求 ， 利 用 各 种 工具 ， 将 数据 仓库 中 的 历史 数据 
进行 展示 和 挖掘 ， 生 成 各 种 图 表 ， 然 后 进行 分 类 和 聚 类 ， 最 后 根据 展示 出 来 的 数据 或 者 挖掘 
出 来 的 信息 ， 辅 助 相 关 人 员 做 出 决策 分 析 。 

C5) 对 于 系统 的 改进 和 完善 

当 系 统 上 线 之 后 ， 用 户 可 能 在 一 段 时 间 之 后 ， 会 提出 更 多 的 需求 ， 这 时 候 需 要 对 系统 
进行 改进 和 完善 。 改 进 系统 时 ， 数 据 仓库 作为 基础 ，OLAP 技术 用 于 报表 的 生成 ， 而 数据 
集 市 用 于 产生 各 种 决策 信息 。 


15.3” 丙 业 智能 具有 的 应 用 功能 


商业 智能 系统 应 该 具有 以 下 的 应 用 功能 ， 如 图 15-3 Bron: 

(1) 关联 分 析 功 能 

关联 分 析 主 要 发 现 事 物 之 间 的 关联 性 ， 预 测 当 一 个 事件 发 生 的 时 候 ， 力 外 一 件 事情 发 生 
的 概率 。 关 联 分 析 的 重点 在 于 快速 发 现 事物 发 生 的 规律 ， 可 以 利用 关联 分 析 实 现 客户 的 精准 



































144 





营 铜 ， 吸 引 更 多 的 客户 ， 同 时 提供 更 好 的 服务 。 


SeA s 
MESMA 


s T 
8 | 有 
T Ea 
Li 的 
A 数 
EM 所 





图 15-3 ”商业 知 能 具有 的 应 用 功能 


(2) 监视 预警 功能 

显示 符合 条 件 的 数据 ， 同 时 设置 条 件 和 规则 ， 增 加 监视 预警 的 功能 。 
(3) 选择 需要 的 数据 

从 大 量 的 数据 中 ， 选 择 用 户 关 注 的 数据 。 

(4) 报表 展示 功能 

文 持 报表 展示 的 功能 ， 将 结果 按照 一 定 的 形式 展现 给 用 户 。 

(5) 数据 输出 功能 

将 统计 分 析 的 结果 数据 输出 给 其 他 应 用 程序 ， 同 时 可 以 展示 成 各 种 图 表 。 


15.4 了 商业 智能 应 用 实例 


当 企业 对 信息 的 需求 和 使 用 达到 指数 级 增长 的 时 候 ， 也 刺激 了 对 决策 分 析 需 求 的 快速 增 
长 。 商 业 智 能 有 很 多 的 应 用 实例 ， 例 如 可 以 建立 企业 级 的 报表 ， 对 立方 体 的 分 析 ， 对 数据 的 
任意 查询 分 析 、 挖 据 和 预警 等 。 

一 般 来 说 ， 商 业 智 能 在 企业 中 有 以 下 几 个 应 用 : 

(1) 商业 智能 在 绩效 管理 中 的 应 用 

随 看 技术 发 展 的 成 熟 ， 商 业 智能 在 企业 绩效 管理 中 越 来 越 普及 ， 它 可 以 搜集 各 类 企业 的 
数据 ， 经 过 分 析 和 处 理 ， 分 析 自 身 的 缺陷 和 不 足 ， 同 时 对 企业 的 发 展 趋势 进行 预测 。 

(2) 商业 智能 在 电 商 网 站 的 应 用 

通过 在 电 商 网 站 挖掘 客户 的 行为 记录 ， 提 取 有 用 的 信息 ， 可 以 使 企业 快速 把 握 市 场 的 动 
态 ， 提 高 企业 对 市 场 的 创新 能 力 和 啊 应 能 

(3) 商业 智能 在 营销 战略 上 的 应 用 

商业 智能 可 以 通过 ETL 工具 ， 数 据 挖 抉 工具 和 OLAP 工具 去 收集 和 分 析 客 户 的 行为 信 
县 。 然 后 进行 与 客户 相关 的 数据 分 析 和 辅助 决策 文 持 。 企 业 一 般 的 做 法 是 在 CRM 系统 中 引 
入 商业 智能 ， 为 企业 挖掘 新 的 销售 渠道 ， 挖 掘 潜在 有 价值 的 客户 。 同 时 可 以 对 客户 提供 个 性 
化 的 服务 ， 提 高 对 客户 的 服务 质量 和 客户 的 满意 度 ， 实 现 交 叉 营 销 。 
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15.9 本章 小 结 


D 商业 智能 应 用 设计 应 该 这 循 以 下 几 个 原则 : 前 瞻 性 、 实 用 性 、 可 操作 性 、 可 信和 性 、 


安全 性 、 易 用 性 。 
2) 商业 智能 系统 应 该 具有 以 下 的 应 用 功能 : 关联 分 析 功 能 、 监 视 预 警 功能 、 选 择 需 要 


的 数据 、 报 表 展 示 功 能 和 数据 输出 功能 
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ss 16 瘟 ” 数 据 抽 取 、 转 找 和 加 载 


本 章 目标 
本 章 主 要 介绍 ETL 的 定义 和 总 体 架 构 、ETL 的 流程 、ETL 的 加 载 策略 、 利 用 ETL 构建 
企业 级 数据 仓库 、ETL 的 设计 过 程 、ETL 的 备份 与 恢复 等 内 容 。 
学 习 本 章 后 ， 您 将 掌握 : 
e ETL 的 定义 和 总 体 架 构 。 
e ETL 的 加 载 方法 。 
利用 ETL 构建 企业 级 数据 仓库 。 
ETL 的 设计 过 程 。 
ETL 的 备份 与 恢复 。 
ETL 数据 质量 的 改进 。 
ODS 设计 与 抽取 。 
数据 仓库 (DW) 设计 与 抽取 。 
e 数据 集 市 (DM) 设计 与 抽取 。 


16.1 ETL 的 定义 和 总 体 染 构 





ETL 是 数据 抽取 (Extract)、 转 换 (Transform)、 加 载 (Load) WS, ERF TAAR 
业 智 能 项 目 ， 是 构建 数据 仓库 最 重要 的 一 步 。 系 统 通 过 ETL 过 程 将 数据 源 中 的 数据 经 过 转 
换 和 整合 加 载 到 数据 仓库 中 。 下 面 对 ETL 功能 架构 中 的 抽取 、 清 洗 、 转 换 、 加 载 等 内 容 进 
行 评 细 的 介绍 。 


(1) 抽取 
抽取 是 源 数据 进入 到 数据 仓库 中 的 第 一 ps 


步 。 因 为 每 个 业务 系统 数据 的 质量 各 不 相同 ， 
所 以 需要 对 每 个 数据 源 建 立 不 同 的 抽取 程序 ， 


而 抽取 的 目的 就 是 将 这 些 数据 源 中 的 数据 抽取 e 
出 来 ， 传 递 给 下 一 阶段 中 的 清洗 步骤 。 ps QOL IBS)» Lies 
抽取 的 主要 功能 如 图 16-1 所 示 。 


1) 提供 数据 适 配 喜 的 功能 : 数据 抽取 的 功 
能 应 该 包含 对 数据 适配器 的 支持 ， 使 得 抽取 程 
序 可 以 与 多 种 业务 数据 源 相 和 连接。 一 般 来 说 ， 
数据 适配器 包含 对 JDBC、ODBC、XML 等 方 
式 的 文 持 ， 为 两 端的 数据 交换 提供 最 基本 的 
条 件 。 图 16-1 抽取 的 主要 功能 
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2) 提供 标准 化 的 功能 : 抽取 最 重要 有 的 一 个 功能 就 是 对 数据 类 型 的 标准 化 ， 将 业务 数据 
源 和 数据 仓库 中 的 数据 类 型 统一 。 

3) 提供 批 处 理 的 服务 : 主要 负责 抽取 流程 的 启动 、 监 探 任务 的 执行 、 对 批 处 理 任务 的 
重启 恢复 、 上 自动 调度 抽取 程序 等 。 一 般 使 用 成 熟 的 ETL 工具 去 完成 复杂 的 监控 处 理 。 

4) 提供 过 滤 的 功能 : 抽取 程序 可 以 根据 实际 的 需要 ， 为 业务 数据 源 提 供 过 滤 的 功能 ， 
以 你 证 数据 的 质量 。 

(2) 清洗 

清洗 是 源 数据 进入 到 数据 仓库 中 的 第 二 步 。 清 洗 的 目的 是 保证 源 数 据 的 数据 质量 符合 
数据 仓库 的 要 求 ， 同 时 保证 数据 的 一 致 性 。 清 洗 程序 可 以 分 成 两 类 ， 如 图 16-2 所 示 。 当 业 
务 系 统 源 数据 的 清洗 规则 和 处 理 流 程 各 不 相同 时 ， 为 了 保证 数据 的 一 致 性 ， 可 以 对 不 同 的 
业务 源 数 据 编写 各 目 专 用 的 清洗 程序 ， 当 所 有 业务 系统 源 数 据 的 清洗 规 则 和 处 理 流程 都 相 
同时 ， 可 以 编写 通用 的 清洗 程序 ， 从 而 保证 数据 的 质量 和 数据 的 一 致 性 。 当 然 ， 在 编写 通 
用 清洗 程序 的 时 候 ， 为 了 满足 业务 的 需求 ， 减 少 代 但 的 重复 ， 可 以 通过 编写 通用 函数 的 方 
式 去 处 理 相 同 的 清洗 规则 和 处 理 流 程 ， 以 达到 提高 系统 效率 、 减 少 代 码 编写 量 的 目的 。 

清洗 的 主要 功能 如 图 16-3 Bros. 





























数据 修 
正 功能 
个 

清洗 的 

主要 功能 
专用 清洗 通用 清洗 匹配 与 < - 数据 标 
程序 程序 合并 功能 准 化 功能 

图 16-2 清洗 程序 的 分 类 图 16-3 清洗 的 主要 功能 














1) 数据 修正 功能 : 使 用 固定 算法 或 者 相应 的 数据 源 检查 程序 去 验证 信息 是 否 准确 。 

2) 数据 标准 化 功能 : 将 业务 数据 源 的 数据 标准 化 ， 以 满足 数据 仓库 中 的 数据 一 致 的 
要 求 。 

3) 匹配 与 合并 功能 : 对 抽取 出 来 的 数据 进行 重复 验证 ， 然 后 对 重复 数据 进行 单独 合并 。 

(3) 转换 

转换 是 源 数据 进入 到 数据 仓库 中 的 第 三 步 ， 也 是 最 重要 的 一 个 步骤 。 转 换 在 抽取 和 清洗 
的 基础 上 对 源 系 统 所 抽出 的 数据 进行 操作 ， 是 业务 系统 数据 进入 到 数据 仓库 中 的 最 后 一 次 
修改 。 

转换 的 主要 功能 如 图 16-4 所 示 。 

D ) 对 数据 进行 计算 : 根据 业务 需求 的 特点 对 业务 源 数 据 进行 相关 的 计算 ， 以 满足 数据 
仓库 的 要 求 。 

2) 对 数据 进行 放大 : 根据 实际 的 业务 需求 ， 为 数据 添加 额外 的 信息 ， 从 而 保证 数据 仓 
库 的 一 致 性 和 正确 性 。 
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(42 加载 

加 载 是 ETL 过 程 中 的 最 后 一 步 。 它 主要 负责 将 数据 加 载 到 目标 表 中 ， 这 些 目标 表 可 能 
是 事实 表 ， 也 可 能 是 维度 表 。 加 载 最 重要 的 作用 了 束 是 按照 数据 模型 中 各 个 实体 之 间 的 关系 将 
抽取 的 数据 加 载 到 目标 表 中 ， 使 用 代理 键 符 换 原来 的 主键 或 者 外 键 〈 代 理 键 一 般 是 用 在 
OLAP 的 星 形 模型 中 ， 通 过 添加 一 个 序列 作为 该 表 的 主键 值 ， 目 的 是 防止 修改 源 表 信息 后 同 
时 修改 历史 数据 信息 ， 加 入 代理 键 的 作用 就是 当 源 表 的 某 条 记录 被 修改 时 ， 将 修改 记录 加 入 
到 目标 表 中 ， 它 的 主键 永远 不 会 重复 ， 而 是 作为 一 条 完整 的 、 新 的 历史 记录 加 载 到 目标 表 
中 )， 同 时 加 载 过 程 中 也 应 该 具有 容错 的 能 力 ， 能 够 在 出 现 错误 的 时 候 不 影响 其 他 程序 的 执 


行 。 生 成 代理 键 的 过 程 如 图 16-5 所 示 。 
MH ugs 部 门 
1 


销售 
10001 an] 
AJ 
10002 | 资源 
部 门 
生产 
部 门 


IT 部 门 




































10001 销售 部 门 


vm | 生成 代理 键 
10002 [一 一 > 
对 数据 进行 计算 10003 生产 部 门 


à 对 数据 进行 放大 m Duti 


图 16-4 转换 的 主要 功能 图 16-5 生成 代理 键 的 过 程 


10004 





(50 元 数据 管理 


元 数据 管理 用 于 定义 ETL 流程 中 所 涉及 的 所 有 环节 ， 抽取 
如 图 16-6 所 示 。 元 数据 按照 用 途 可 以 分 为 技术 元 数据 和 业 x 


务 元 数据 。 技 术 元 数据 是 存储 数据 仓库 技术 细节 性 的 数 
据 ， 是 数据 仓库 开发 和 管理 所 使 用 的 数据 ， 主 要 包括 数据 
仓库 的 模式 、 维 度 、 层 次 的 定义 。 业 务 元 数据 从 业务 角度 
去 描述 数据 仓库 的 信息 ， 是 数据 仓库 开发 人 员 和 业务 人 员 
沟通 的 桥架 ， 主 要 包括 企业 概念 模型 和 多 维 数据 模型 的 结 
构 和 定义 。 元 数据 管理 也 是 数据 质量 管理 的 关键 。 

ETL 的 框架 结构 包含 了 业务 数据 源 、ODS 数据 缓冲 图 16-6 元 数据 管理 
X. ODS 统一 信息 视图 区 、 数 据 仓库 (DW )、 数 据 集 市 
(DM) AR, WK 16-7 所 示 。 


{T 

al 
D Ve 
vH MP 
所 请 
XL 





Qj 








ETL 总 体 架 构 









gh 


业务 数据 源 


图 16-7 ETL 的 框架 结构 
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16.2. EIL 的 加 载 方法 


16.2.1 以 时 间 戳 作为 加 载 条 件 


利用 时 间 惟 的 方式 对 目标 表 进 行 数据 加 载 是 相对 简单 的 一 种 方法 。 可 以 利用 业务 源 数据 
表 已 有 的 时 间 宇 段 ， 也 可 以 添加 一 个 时 间 宇 段 作 为 时 间 戳 ， 当 业务 数据 表 里 的 数据 修改 或 者 
添加 时 ， 同 时 也 会 修改 或 者 添加 时 间 宇 段 里 的 值 ， 可 以 通过 系统 时 间 与 源 数据 表 中 的 时 间 字 
段 进行 比较 ， 来 判断 该 记录 是 否 应 该 加 载 到 目标 表 中 。 这 种 以 时 间 惟 作为 数据 加 载 条 件 的 优 
点 是 可 以 使 ETL 设计 简单 清晰， 抽取 的 效率 相对 较 高 ， 并 且 可 以 实现 ETL 数据 加 载 的 需 
求 ; 缺点 是 需要 对 业务 源 数据 的 时 间 惟 进行 维护 。 

下 面 使 用 Informatica 工具 ， 用 时 间 玲 的 方式 进行 数据 加 载 。 

(1) 设计 源 表 和 目标 表 

源 表 如 图 16-8 所 示 。 其 中 ID 是 主键 ，YEAR、MON Æ ER. 

目标 表 如 图 16-9 所 示 。 其 中 ID 是 主键 。 


























mE TARGET (Oracle) 
m Target Definition 


number 
number 


varchar? 


varchar? 
varchar? 
varchar? 





图 16-8 MK 图 16-9 目标 表 


(2) 设计 Mapping 
Mapping 的 设计 如 图 16-10 所 示 : 它 的 抽取 频率 被 设置 成 每 月 抽取 一 次 。 


SOURCE LOracl Sp SOüURCE FILTRANS LEPTRANS UPOTRANS TARGET LOracl 
e) ej 





图 16-10 Mapping 设计 (一 ) 
Mapping 展开 后 如 图 16-11 所 示 。 


SOURCE Cūraclej I] | | 7 BARLETE 
Source Definition F | ualifier | | Filter 


double double 
string string 


string string 
string string 





图 16-11 Mapping xit (—) 
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(3) 组 件 的 该 计 
FILTRANS 〈 过 滤器 ) 组 件 设计 如 图 16-12 所 示 。 


| FILTRANS 


atring 





图 16-12 FILTRANS 组 件 设计 








FILTRANS 过 滤 方 法 是 判断 源 表 的 时 间 惟 YEAR. MON 字段 是 否 等 于 ETL 服务 器 的 系 
统 时 间 ， 或 者 时 间 惟 YEAR. MON 字段 等 于 固定 的 数值 。 

FILTRANS 的 代码 如 图 16-13 所 示 。 

Lookup 组 件 设 计 如 图 16-14 所 示 。 


ll Expression Editor: <name> - FILTRANS (Filter) x| 


x 
Functions | ors | Variables | Formula #8 | -] C $ B x 


DL] All Functions 
DD Character 

LI) Conversion 
.D Data Cleansing 
CJ Date 

O Humerical 

O Scientific 

LJ Special 

-O Test 

L Variables 

D Lookups 


















Ito char (sysdate, yr )-to char(YEAR) and to char 
(sysdate, mn )-to char (MON) 






pm LKPTRANS 
O Lookup Procedure 





+ -HB-H-B HB -图 图 图 -图 HB Œ 





YEAR SRC 
MONT SRC 
ID SRC 

NAME SRC 


Functions in the All zl 
Pacon adc om mm I 














图 16-13 FILTRANS (过 滤器 ) 代码 


Lookup 组 件 的 查询 条 件 如 图 16-15 所 示 。 
EI 4 


Transformation | Forts | Properties Condition | Metadata Extensions | 


Select [es XPTRANS -| 
， Transformation Lookup Procedure put & e*t. 
| Lookup Table Coluan Operator Transformation Port 





取消 | umo [ sw | 


图 16-15 Lookup 组 件 的 查询 条 件 
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Update 组 件 设 计 如 图 16-16 所 示 。 


LE EJE] 
[lpdate Stratewy 






ID double 

MAME string 4l] 
ID SRC double 15 
NAME SR string 4l 





图 16-16 Update 组 件 设 计 


Update 组 件 的 过 小 代码 如 图 16-17 所 示 。 





| Expression Editor: zname- - UPDTRANS (Update Strategy) xÍ 


Functions | Ports | Variables | Formula #8 | | £2 部 B x 











H- All Functions hifi 

m haere te isnullíID), dd insert, 
E-L] Conversion ru 

由 O Data Cleansing iif ((ID Iz ID SRC 
由 - Date or 

&- LJ Numerical NAME !- NAME SRC )， 
由 器 Scientific dd update, dd reject 
由 … Special ) ) 

* C) Test 

* C) Variables 

d-EO Lookups 

Functions in the All zl Numeric keypad 

v. s ow - eo M 


EE E 
ES ESSE 
EA JEA EN 

ix] 


L9 | 


um 
T 
4 
1 








图 16-17 Update 组 件 的 过 滤 代 码 





(4) 源 表 到 目标 表 的 映射 
假设 当前 ETL 服务 器 的 系统 时 间 为 2011 年 1 月 31 日 ， 源 表 的 数据 见 表 16-1- 
表 16-1 源 表 的 数据 


ID NAME YEAR MON 


以 时 间 惟 作为 加 载 条 件 ， 经 过 ETL 抽取 之 后 目标 表 的 数据 见 表 16-2. 


表 16-2 目标 表 的 数据 


ID NAME 
1 四 

2 OC 

3 内 


源 表 修改 后 的 数据 见 表 16-3。 
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表 16-3 源 表 修改 后 的 数据 


| [09 [oo 
| 
: | 


再 经 过 ETL 数据 抽取 之 后 ， 目 标 表 的 数据 见 表 16-4. 


表 16-4 目标 表 的 新 数据 


ID NAME 
1 FH 

2 a 

3 T 


16.2.2 ”利用 源 表 的 日 志 信 息 对 目标 表 进 行 数据 加 载 


在 业务 系统 中 为 源 表 添加 日 志 表 ， 当 源 表 中 的 数据 增加 、 删 除 、 修 改 时 ， 及 时 更 新 该 源 
表 的 日 志 表 。 在 进行 ETL 数据 加 载 时 ， 通 过 读 取 源 表 的 日 志 信息 决定 为 目标 表 加 载 哪些 源 
表 的 数据 。 这 样 做 的 优点 是 不 需要 更 改 数据 源 表 的 表 结 构 和 数据 ， 降 低 了 数据 加 载 的 风险 。 
缺点 是 需要 维护 日 忘 表 的 数据 ， 增 加 了 系统 的 开销 。 更 狐 日 志 表 的 方式 可 以 通过 触 友 器 对 日 
志 表 有 的 信息 进行 修改 ， 如 图 16-18 所 示 。 


























二 





C 2 ELLEN (CC 人 
Meis |O ETE 


图 16-18 利用 源 表 的 日 志 信 息 对 目标 表 进 行 数据 加 载 











16.2.3 ”通过 全 表 对 比 的 方式 进行 数据 加 载 


通过 全 表 对 比 的 方式 进行 数据 加 载 ， 是 对 目标 表 的 每 条 数据 进行 比较 ， 当 目标 表 不 存在 
该 主键 值 时 ， 进 行 插入 操作 ， 如 果 该 主键 值 已 丝 存在 ， 则 需要 对 其 余 字 段 进 行 比 较 ， 如 果 有 
不 相同 的 数值 ， 则 需要 进行 更 新 操作 。 全 表 对 比 的 方式 不 需要 对 业务 源 数 据 表 进行 任何 修 
改 ， 安 全 性 较 高 ， 但 是 由 于 流程 较为 复杂 ， 一 般 抽 取 的 效率 较 低 。 
下面 利用 Informatica 工具 ， 通 过 全 表 对 比 的 方式 进行 数据 加 载 。 
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CD. 设计 源 表 和 目标 表 
源 表 如 图 16-19 所 示 。 其 中 ID 是 主键 ，YEAR、MON ÆW EER. 
目标 表 如 图 16-20 PR, HP ID 是 主键 。 


SülRCE EÉüraclelJ mE TARGET [üracle!] 
Source Definition P Target Definition 
Datatype 


number 


number 


varcharz 
varcharz 


varchar? 
varcharz 





16-19 JK 16-20 HERE 


(2) 设计 Mapping 
Mapping 的 设计 如 图 16-21 所 示 : 它 的 抽取 频率 被 设置 成 每 月 抽取 一 次 。 





SOURCE LOracl SB SOURCE LEPTRANS UPOTRANS TARGET LOracl 
e) e) 


16-21 Mapping 设计 (一) 
Mapping 展开 后 如 图 16-22 所 示 。 


SOURCE LüracleJ ; 5B SOURCE 
Source Definition Source Qualifier 


double 

string l 

string j ID SOURCE double 

string uen NAME SOURCE string 
YEAR SOURCE string 
MUN l IIR ing 





16-22 Mapping ixit (—) 


(3) 组 件 的 设计 
Lookup 组 件 设计 如 图 16-23 所 示 。 


ID SOURCE double 


MAME SOURCE —— string 
YEAR SDURCE string 
HON SOURCE string 





16-23 Lookup 组 件 设计 


154 


Lookup 组 件 的 查询 条 件 如 图 16-24 所 示 。 


Edit Transformations 


| Lookup Table Column | Üüperator | Transformation Fort 
mL 图: o [mew 





pH GO 
16-24 Lookup 组 件 的 查询 条 件 
Update 组 件 设 计 如 图 16-25 所 示 。 


UPDOTRANS 
Update Strategy 


E 
u 


double 
string. — — 40 
[Lco dq 
| | | 





图 16-25 Update 组件 设计 


Update 组 件 的 过 小 代码 如 图 16-26 Przn. 


lll Expression Editor: <name> - UPDTRANS (Update Strategy) 





iif(isnull(ID),dd insert,iif (ID!-ID SOURCE or NAME! A 
disi -NAME SOURCE, dd update, dd reject)) | 
onversion 

H-O Data Cleansing 
Date 

Numerical 


BL Scientific 
HLI Special 
Test 


Variables 
Lookups 














图 16-26 Update 组 件 的 过 滤 代 码 


(4). 源 表 到 目标 表 的 映射 
假设 当前 ETL 服务 器 的 系统 时 间 为 2011 年 1 月 31 日 ， 源 表 的 数据 见 表 16-5. 


155 


R 16-5 源 表 的 数据 


| 


通过 全 表 对 比 的 方式 进行 数据 加 载 ， 经 过 ETL 抽取 之 后 目标 表 的 数据 见 表 16-6. 


表 16-6 目标 表 的 数据 


ID NAME 
1 张 三 
本 站 
3 F 


修改 源 表 的 数据 ， 见 表 16-7. 


表 16-7 源 表 修改 后 的 数据 


| : 
: | 


再 经 过 ETL 数据 抽取 之 后 ， 目 标 表 的 数据 见 表 16-8. 


表 16-8 目标 表 的 新 数据 


ID NAME 
1 xq-5 
2 4 pu 
3 SES 





16.2.4 ERMIR Jr ER T2 TERT] A 


全 表 删 除 后 再 进行 数据 加 载 的 方式 的 实现 相对 简单 。 但 是 不 能 实现 数据 的 递增 加 载 ， 只 
能 删除 目标 表 的 数据 之 后 ， 再 经 过 ETL 为 目标 表 加 载 数据 ，Informatica 工具 提供 了 这 样 的 一 
种 功能 ， 在 WorkFlow 的 Session 中 设 定 Attribute《〈 属 性 定义 )， 再 选择 Truncate target table 
option 即 可 ， 如 图 16-27 HIZR. 

总 结 : ETL 的 加 载 方法 包括 全 量 加 载 和 增 量 加 载 ， 如 图 16-28 所 示 。 从 技术 角度 上 说 ， 
全 量 加 载 的 方式 比 增 量 加 载 要 简单 很 多 ， 使 用 增 量 加 载 的 方法 ， 难 度 在 于 必须 设计 正确 有 效 
的 方法 从 数据 源 中 抽取 变化 的 数据 ， 同 时 将 这 些 变 化 的 数据 更 新 到 数据 仓库 中 ， 如 果 每 次 抽 
取 都 有 超过 1/4 的 业务 源 数据 需要 更 狐 ， 束 应 该 考虑 更 改 ETL 的 加 载 方法 ， 由 增 量 抽取 改 为 
全 量 抽 取 。 全 量 抽 取 对 于 数据 量 较 小 ， 更 狐 频 识 较 低 的 系统 比较 适用 。 
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。 [以 时 间 惟 作为 加 载 e ZEE E EFT 


的 条 件 数据 加 载 的 方式 
。 利 用 源 表 的 日 志 信 

















息 对 目标 表 进 行 数 
据 加 载 

。 通 过 全 表 对 比 的 方 
式 进行 数据 加 载 


























取消 | mmo | sw | 





图 16-27 Ù Attribute 图 16-28 ETL 的 加 载 方法 


16.3 ”利用 EL 构建 企业 级 效 据 仓库 








D 在 构建 数据 仓库 系统 的 时 候 ， 通 名 的 做 法 是 将 业务 系统 部 普 在 一 合 服务 袁 中 ， 而 数 
据 仓 库 系 统 部 署 在 另外 一 台 服 务 器 中 ， 如 网 16-29 所 示 。 考 虑 到 数据 仓库 系统 需要 从 业务 系 
统 中 不 断 访问 数据 ， 而 且 数 据 量 较 大 ， 所 以 需要 在 数据 仓库 系统 和 业务 系统 之 间 建 立 一 个 数 
JERI, WME 16-30 所 示 。 通 过 ETL 先 将 业务 系统 中 的 数据 抽取 到 数据 缓存 区 中 ， 然 后 
再 对 数据 缓存 区 的 数据 进行 处 理 ， 这 样 吏 可 以 避免 数据 仓库 系统 频 索 地 访问 业务 系统 ， 防 止 
在 业务 系统 中 进行 大 量 的 整合 、 计 算 等 工作 ， 降 低 了 对 业务 系统 性 能 的 影响 。 数 据 抽 取 的 频 
率 可 以 是 每 天 或 者 每 月 ， 因 为 数据 缓存 区 域 只 保存 当前 的 实时 数据 ， 数 据 量 相 对 较 小 ， 在 数 
据 绥 存 区 中 进行 转换 、 清 洗 、 整 合 的 操作 ， 效 率 相对 较 高 ， 这 样 不 仅 提 高 了 数据 仓库 系统 的 
整体 性 能 ， 同 时 也 你 证 了 数据 的 一 致 性 。 
































SURE 














图 16-29 ”数据 仓库 直接 访问 数据 源 


2) 构建 企业 数据 仓库 需要 充分 发 挥 时 间 崔 的 作用 。 在 ETL 过 程 中 ， 通 党 把 时 间 鹤 作为 
抽取 的 标识 ， 例 如 从 业务 系统 中 抽取 每 天 的 数据 ， 就 可 以 使 用 时 间 惟 作为 抽取 的 条 件 。 

3) 在 构建 企业 数据 仓库 时 ， 可 以 使 用 ETL 过 程 中 产生 的 日 志 信 息 去 查看 数据 处 理 的 情 
况 ， 日 忘 一般 记录 了 ETL 过 程 中 产生 的 详细 信息 ， 包 括 数据 抽取 成 功 的 次 数 和 记录 数 ， 数 
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据 抽 取 失 败 的 次 数 和 记录 数 等 内 容 。 可 以 根据 日 志 信 息 对 构建 企业 数据 仓库 过 程 中 产生 的 问 
题 进 行 修改 和 调整 


WREE 


MN 
ex 








/ 数据 源 | 
数据 缓存 区 Sari 


图 16-30 ”建立 数据 缓存 区 


16.4 EIL 的 设计 过 程 


(1) 数据 源 和 ODS 之 间 的 对 应 

需要 记录 源 数据 和 目标 数据 的 数据 库 类 型 、 服 务 嚣 卫 、 数 据 库 名 称 、 用 户 名 和 密码 。 
在 进行 ETL 设计 时 ， 需 要 设 定 抽取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 
ODS 设计 见 表 16-9. 





表 16-9 ODS 设计 


抽取 周期 月 
抽取 条 件 一 次 做 全 量 抽 取 ， 后 面 只 抽取 前 一 月 的 数据 


数据 源 和 ODS 之 间 的 对 应 见 表 16-10. 








表 16-10 数据 源 和 ODS 之 间 的 对 应 


行业 类 型 编码 | TRADEID TID 转换 规则 参照 行业 类 型 编码 表 
地 区 编码 
购买 商品 数量 参照 源 表 进 行 汇总 相 加 
(2) ODS 和 数据 仓库 之 间 的 对 应 
需要 记录 源 数据 和 目标 数据 的 数据 库 类 型 、 服 务 器 了、 数据 库 名 称 、 用 户 名 和 密码 。 
在 进行 ETL 设计 时 ， 需 要 设 定 抽取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 
数据 仓库 设计 见 表 16-11。 














表 16-11 数据 仓库 设计 


抽取 周期 月 
抽取 条 件 全 部 
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ODS 和 和 数据 仓库 之 间 的 对 应 见 表 16-12. 


目标 字段 
客户 编号 
行业 类 型 编码 
地 区 编码 
购买 时 间 
H4 
年 份 
购买 商品 数量 


表 16-12 ODS 和 数据 仓库 之 间 的 对 应 


[ cuo | em | wee | 
pep | maxp | veeo | — 
[ wsmcr | sme | wem | — 
[ mwwws | www | omw | — 
[xm OO on | emen 到 
[mw | Gen | wem | 





备 dm 


(3) 数据 仓库 和 数据 集 市 之 间 的 对 应 


需要 记录 源 数 据 和 目标 数据 的 数据 库 类 型 、 
在 进行 ETL 设计 时 ， 





服务 如 IP、 数 据 库 名 称 、 用 记名 和 窗外。 
需要 设 定 抽 取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 








其 中 事实 表 的 设计 见 表 16-13. 


主题 描述 : 按时 间 、 地 区 、 行 业 、 统 计 和 客户 购买 商品 的 信息 进行 撞 述 ， 并 且 进 行 同期 比 








较 ( 例 如 对 2011 4E 1 HA 2010 4E 1 月 进行 对 比 > 


目标 字段 
A) 
行业 类 型 编码 
地 区 类 型 编码 
购买 时 间 
年 份 
月 份 
购买 商品 数量 


表 16-13 事实 表 的 设计 


Fusow [sow | wm | — 

mapu | mapu | wem | — — 

aa | sovo | wwe | — 
UM 





地 区 维 表 见 表 16-14. 


表 16-14 地 区 维 表 


抽取 周期 H 
抽取 条 件 全 部 


地 区 维 表 的 设计 见 表 16-15. 


表 16-15 地 区 维 表 的 设计 


TET TET "ENT 
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行业 关 别 维 表 见 表 16-16. 


表 16-16 行业 类 别 维 表 
抽取 周期 
抽取 条 件 全 部 


行业 维 表 的 设计 见 表 16-17。 


表 16-17 行业 维 表 的 设计 


字段 名 称 字段 类 型 & d 


16.5 ETL 的 备份 与 恢复 


16.5.43 ”数据 的 备份 


1. ODS 数据 的 备份 

默认 ODS 采用 的 是 Oracle 数据 库 ， 它 的 备份 设计 如 下 : 

D 可 以 采用 全 量 备 份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数据 进行 备份 。 备 份 
的 周期 可 以 根据 需要 灵活 变动 ， 一 般 是 每 周 进 行 一 次 备份 ， 保 留 一 个 月 左右 的 备份 数据 。 

2) 可 以 采用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 志 增 量 文件 进行 备份 。 通 名 需要 保留 近 
两 个 月 的 备份 数据 。 

2. 数据 仓库 的 数据 备份 

默认 数据 仓库 采用 的 是 Oracle 数据 库 ， 它 的 备份 设计 如 下 : 

1) 可 以 采用 全 量 备 份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数据 进行 备份 。 由 于 
数据 仓库 数据 量 巨 大 ， 可 以 2—3 周 进行 一 次 全 量 备 份 ， 通 党 保存 一 个 月 左右 的 备份 数据 。 

2) 可 以 采用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 志 增 量 文件 进行 备份 。 通 名 保存 近 两 个 
月 的 备份 数据 。 

3. 数据 集 市 的 数据 备份 

默认 数据 集 市 的 数据 存放 到 Oracle 数据 库 中 ， 多 维 数据 采用 Cognos OLAP 技术 。 

D 对 于 数据 集 市 数据 可 以 采用 全 量 备 份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数 
据 进 行 备份 。 通 和 保存 一 个 月 左右 的 备份 数据 。 如 果 采 用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 
志 增 量 文 件 进 行 备份 ， 通 党 保存 近 两 个 月 的 备份 数据 。 

2) 因为 Cognos OLAP 模型 存放 在 固定 路 和 任 文 件 夹 下 ， 并 没有 太 多 的 数据 量 ， 每 天 进行 
全 量 备份 即 可 。 


16.5.2. ”数据 备份 存放 的 介质 以 及 目录 结构 
1) ODS 数据 全 量 可 以 备份 到 磁带 库 或 者 是 RAID 阵列 介质 上 ， 然 后 在 介质 上 建立 两 个 
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文件 夹 ， 例 如 /back/ods/beifen1、/back/ods/beifen2， 保 留 两 次 最 近 的 全 量 备份 。 

2) ODS 数据 增 量 可 以 备份 到 RAID 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/ods/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

3) 数据 仓库 数据 全 量 可 以 备份 到 磁 市 库 或 者 是 RAD 阵列 介质 上 ， 然 后 在 介质 上 建立 
两 个 文件 夹 ， 例 如 /back/dw/beifen1、/back/dw/beifen2， 保 留 两 次 最 近 的 全 量 和 备份。 

4) 数据 仓库 数据 增 量 可 以 备份 到 RAD 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/dw/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

5) 数据 集 市 数据 全 量 可 以 备份 到 人 磁 市 库 或 者 是 RAD 阵列 介质 上 ， 然 后 在 介质 上 建立 
两 个 文件 夹 ， 例 如 /back/dm/beifen1、/back/dm/beifen2， 保 留 两 次 最 近 的 全 量 备份 。 

6) 数据 集 市 数据 增 量 可 以 备份 到 RAID 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/dm/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

7) 多 维 OLAP 模型 可 以 存储 到 RAID 阵列 介质 上 ， 建 立 多 个 文件 夹 以 保存 最 近 的 备份 。 

8) MIRE CE Cognos 知识 库 、ETL 知识 库 、 应 用 程序 知识 库 ) 可 以 备份 到 RAID 
阵列 介质 上 。 一 般 采 取 的 方式 是 全 量 备份 ， 将 不 同 的 知识 库 保 存 到 不 同 的 目录 下 。 


165.3 ETL 程序 的 备份 


默认 ETL 工具 是 PowerCenter, ETL 程序 的 备份 包括 开发 人 员 编 写 的 程序 代码 〈 包 括 从 
业务 系统 到 ODS 数据 缓冲 区 的 ETL FEF, M ODS 数据 缓冲 区 到 ODS 统一 信息 视图 区 的 
ETL 程序 ， 从 ODS 统一 信息 视图 区 到 数据 仓库 的 ETL 程序 ， 从 数据 仓库 到 数据 集 市 的 ETL 
程序 )， 各 种 参数 的 配置 ，ETL 工具 的 软件 等 。 

16.5.4 ”数据 的 恢复 方案 


CD 操作 系统 的 恢复 〈 见 图 16-31) 








































































ODS fl 5 às 
操作 系统 












重新 安装 系 
统 ， 根 据 配 
置信 息 配 置 
AREE 
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图 16-31 操作 系统 的 恢复 





(2) ODS 数据 的 恢复 〈 见 图 16-32) 
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当 部 分 数据 表 丢 失 
时 ， 可 以 从 全 量 备 






当 数 据 库 系 统 彻底 







月 溃 时 ， 可 以 采用 份 中 导入 数据 ， 然 
全 量 备份 恢复 数据 后 再 恢复 全 量 备份 






时 刻 到 最 新 时 刻 的 
增 量 数 据 






库 系 统 






ODS 数据 
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a) b) 
图 16-32 ODS 数据 的 恢复 
a) ODS 数据 的 恢复 方法 (一) ”b) ODS 数据 的 恢复 方法 (二) 


(3) 数据 仓库 和 数据 集 市 的 恢复 〈( 见 图 16-33) 









数据 仓库 数据 仓库 








当 部 分 数据 表 丢 失 









当 数 据 库 系统 彻底 时 ， 可 以 从 全 量 备 
nd Lo» b HABI, TUR nd 一 》 | 份 中 导入 数据 ， 然 






后 再 恢复 全 量 备 份 
时 刻 到 最 新 时 刻 的 
增 量 数 据 


全 量 备份 恢复 数据 
库 系 统 






数据 集 市 数据 集 市 


a) b) 
图 16-33 ”数据 仓库 和 数据 集 市 的 恢复 
a) 数据 仓库 和 数据 集 市 的 恢复 方法 一 b) 数据 仓库 和 数据 集 市 的 恢复 方法 二 








(4) 知识 库 的 恢复 〈 见 图 16-34) 

















Cognos 知识 库 
的 恢复 


PowerCenter 
知识 库 的 恢复 





使 用 全 量 备 份 
恢复 所 有 的 数 
据 表 ， 并 且 补 
孙 当 天 的 修改 
情况 









图 16-34 ”知识 库 的 恢复 








(5) Cognos OLAP 模型 和 运行 程序 、 运 行 数据 的 恢复 〈 见 图 16-35) 











运行 程序 、 运 行 
数据 的 恢复 


Cognos OLAP 
模型 的 恢复 












使 用 全 量 备份 
对 数据 进行 恢 
复 ， 使 用 文件 
来 下 的 模型 文 
件 对 OLAP 

模型 进行 恢复 












图 16-35 Cognos OLAP 模型 和 运行 程序 、 运 行 数据 的 恢复 
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16.6 ETL 数据 质量 的 改进 


16.6.1 ETL 数据 质量 分 析 


因为 传统 的 业务 系统 多 以 内 部 目 身 的 需求 为 文 撑 点 ， 进 行 相对 独立 的 设计 和 开发 ， 而 缺 
少 对 企业 整体 情况 的 考虑 ， 在 企业 内 部 信息 中 形成 了 许多 信息 孤岛 。 所 谓 信息 扳 岛 ， 是 指 信 
县 之 间 不 共享 ， 信 息 与 业务 流程 之 间 相 互 脐 离 ， 好 像 海 洋 当 中 的 一 个 个 的 孤岛 ， 不 能 满足 信 
县 之 间 共 孚 的 需求 ， 主 要 体现 在 : 

D 不 同 的 业务 系统 中 存在 数据 不 一 致 的 现象 ， 例 如 入 力 资 源 系统 中 的 公司 员工 信息 和 
财务 系统 中 的 公司 员工 信息 不 一 致 。 

2) 数据 杂乱 、 分 散 ， 在 同一 系统 中 出 现 系统 数据 和 人 工 处 理 的 数据 并 存 的 现象 。 

3) 数据 格式 不 统一 ， 相 同 数据 存在 多 样 性 的 特点 。 

4) 数据 信息 存在 严重 缺失 、 不 完整 的 现象 。 

ETL 数据 质量 改进 的 困难 体现 在 : 

D 数据 量 较 大 ， 数 据 类 型 不 统一 。 

2) 数据 质量 没有 一 个 清晰 明确 的 标准 和 定义 。 

3) 系统 的 改造 和 升级 或 者 是 人 为 因素 ， 都 可 能 导致 数据 的 混乱 。 

Zub bMS EHT ETL 数据 质量 分 析 时 ， 需 要 不 断 进 行 修正 ， 尽 量 使 该 系统 的 
编码 满足 编码 规范 和 要 求 。 可 以 采取 使 用 代理 键 的 方法 去 维护 编码 的 可 追溯 性 和 唯一 性 ， 除 此 
以 外 ， 还 需要 过 滤 系 统 的 垃圾 数据 ， 建 立 人 工 映 射 表 去 统一 和 匹配 编码 不 一 致 的 部 分 数据 。 


16.6.2. ETL 数据 质量 改进 的 方法 和 目标 


ETL 数据 质量 主要 从 技术 层面 、 管 理 层面 、 业 务 层面 等 角度 去 分 析 和 改进 。 

10 从 技术 层面 来 说 ， 需 要 对 源 数 据 进行 清洗 ， 以 过 滤 掉 垃圾 数据 和 存在 不 一 致 性 的 数 
据 ， 同 时 需要 对 源 数据 的 质量 进行 评估 ， 然 后 根据 业务 实际 情况 设计 出 完整 的 数据 质量 改 
Xt; 3€. 

2) 从 管理 层面 来 说 ， 应 该 切实 保证 从 业务 系统 源 数据 到 数据 集 市 中 各 个 环节 的 数据 的 
正确 性 、 一 致 性 和 完整 性 。 

3) 从 业务 层面 来 说 ， 对 源 数 据 的 抽取 需要 遵循 相应 的 业务 规则 ， 将 ETL 的 过 程 流程 
化 、 规 范 化 。 

ETL 数据 质量 的 目标 分 为 以 下 几 个 部 分 : 

D 完善 企业 各 个 部 门 之 间 信 息 数 据 的 共享 ， 消 除 信息 孤岛 的 现象 。 

2) 对 现 有 的 数据 进行 标准 化 和 规范 化 。 

3) 规范 ETL 设计 和 开发 的 流程 ， 实 现 对 每 个 流程 的 监督 。 

4) 制定 相应 的 数据 质量 标准 。 


16.6.3 ”推动 ETL 数据 质量 改进 的 方法 
推动 ETL 数据 质量 的 改进 ， 关 键 是 管理 层 、 领 导 层 的 重视 ， 能 够 保证 有 效 的 资源 投 
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入 ， 让 企业 各 个 级 别 的 部 门 都 重视 数据 质量 的 问题 。 同 时 配 有 相应 的 监督 措施 ， 通 过 分 步 又 
实施 、 不 断 完 善 的 原则 奉 找 每 个 分 析 主 题 中 数据 质量 的 缺陷 ， 检 查 从 业务 生产 系统 到 数据 仓 
库 、 数 据 集 市 中 各 个 环节 的 计算 方法 和 转换 步 又 ， 检 得 每 一 个 环节 和 流程 是 售 正 确 ， 层 层 推 
进 ， 从 而 保证 ETL 数据 质量 的 捉 高 和 改进 。 


16.6.4 ETL 的 技术 路 线 选 择 


1. 功能 说 明 

ETL 的 功能 包括 : 数据 抽取 (Extract), fk (Transform), fye (Cleansing )、 闭 载 
(Load)。 它 是 构建 数据 仓库 的 重要 一 环 ， 用 户 从 数据 源 抽取 出 所 需 的 数据 ， 经 过 数据 清洗 ， 
最 终 按照 预先 定义 好 的 数据 仓库 模型 ， 将 数据 加 载 到 数据 仓库 中 去 。 

ETL 分 别 是 “Extract”“Transform”“Load” 三 个 单词 的 首 字母 缩写 ， 它 主要 负责 数据 从 
数据 源 问 目标 数据 仓库 转换 的 过 程 。 

ETL 包含 了 三 方面 。 首 先 ， 将 数据 从 业务 系统 中 读 取 出 来 。 然 后 ， 按 照 预 完 设计 好 的 规 
则 将 抽取 的 数据 进行 转换 ， 使 本 来 寞 构 的 数据 格式 能 集成 起 来 。 最 后 ， 将 转换 完 的 数据 按 增 
量 或 全 量 闭 载 到 数据 仓库 中 。 

一 般 来 说 ，ETL 工具 可 转换 和 衍生 各 种 丰富 信息 ， 以 确保 将 数据 放 在 适当 的 上 下 文 环境 
中 用 于 新 用 途 。 各 种 转换 功能 可 结合 、 改 造 并 汇聚 信息 。 

转换 功能 广泛 又 灵活 ， 可 满足 各 种 集成 要 求 ， 并 高 速 结 合 和 整理 异 构 数据 。 

2. 主要 业务 驱动 

ETL 的 主要 业务 驱动 是 最 大 范围 地 整合 企业 和 外 部 的 数据 源 数据 ， 利 用 可 扩展 的 并 行 处 
理 能 力 转换 海量 的 数据 ， 同 时 处 理 极其 复杂 的 转换 ， 利 用 元 数据 进行 分 机 和 维护 。 

3. 技术 特性 和 主要 需求 

ETL 的 技术 特性 和 主要 需求 是 处 理 多 种 数据 产 、 能 够 并 行 执 行 、 数 据 管 道 功 能 、 数 据 
分 区 功能 、 可 扩展 性 、 直 观 易 用 的 开发 和 维护 环境 、 图 形 化 监控 和 能 够 和 元 数据 管理 平 合 
集成 。 

C1) 处 理 多 种 数据 源 

数据 源 可 以 包括 关系 数据 库 、 外 部 数据 源 、 消 息 队 列 和 各 种 非 结 构 化 数据 。 能 够 执行 必 
需 的 数据 转换 ， 可 能 涉及 到 以 下 转换 ， 主 要 包括 : 各 种 字符 和 数字 格式 的 数据 类 型 之 间 的 转 
换 ， 各 种 业务 派生 和 衍生 计算 ， 对 数据 应 用 业务 规则 和 算法 。 参 照 数据 检查 与 实施 ， 在 建立 
规格 化 的 数据 仓库 的 过 程 中 使 用 此 流程 。 保 证 整个 系统 的 一 致 性 。 使 用 此 技术 ， 用 于 报表 和 
分 析 的 汇聚 。 创 建 分 析 或 报表 数据 库 ， 如 数据 集 市 或 立方 。 此 过 程 涉及 到 将 数据 降 范 式 到 星 
形 或 雪花 形 ， 以 改进 性 能 并 使 业务 用 户 易 于 使 用 。 

(2) 并 行 执行 

能 够 并 行 执行 从 源 系 统 到 目标 系统 的 批量 和 实时 的 数据 转换 和 移动 ， 满 足 数据 整合 的 时 
效 性 需求 。 

(3) 数据 管道 

能 够 将 数据 抽取 、 转 换 、 装 载 过 程 所 需 的 处 理 管道 化 ， 记 录 通 过 管道 进行 流动 ， 这 样 使 
得 记录 通过 一 系列 的 功能 组 件 进 行 流动 而 不 需要 将 记录 加 载 到 人 磁盘。 数据 可 成 块 缓冲 ， 加 速 
数据 处 理 过 程 。 
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(4) 数据 分 区 

数据 分 区 通 委 提供 了 一 种 民 好 的 、 可 以 线性 增长 的 应 用 性 能 。 

(5) 可 扩展 性 

能 够 充分 利用 集群 、 网 格 环境 ， 以 优化 对 所 有 可 用 健 件 资源 的 使 用 ， 能 够 按 需 进行 线性 
扩展 ， 满 足 不 断 增 长 的 数据 量 处 理 需 求 。 

(60 图 形 化 监控 

可 以 直接 从 监控 平台 上 得 知 ETL 每 个 阶段 的 运行 情况 : 包括 执行 处 理 的 名 称 、 每 个 阶 
段 的 状态 、 处 理 的 行 数 、 每 个 阶段 完成 的 时 间 等 内 容 。 


16.7 ETL 应 用 举例 








167.4 ETL 分 析 需 求 
ETL 分 析 需 求 见 表 16-18。 


表 16-18 分 析 需 求 





LA Z IKR m IEL 
需求 目的 按照 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 等 维度 对 客户 数 、 销 售 数量 进行 同比 、 环 比分 析 
维度 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 


时 间 : 年 -季度 -月 
地 区 : JER, b. J M. TAI 





维度 层次 结构 | 
商品 类 别 : 家 电 类 、 电子 类 、 服装 类 、 食品 类 
客户 类 别 : VIP P SAPE. NOB 
分 析 指 标 客户 数 、 销 售 数量 进行 同比 、 环 比分 析 
数据 来 源 企业 销售 系统 
- 公司 决策 领导 人 员 中 层 管理 人 员 商品 销售 人 员 
AA bi 


关注 关注 X 


需求 目的 : 按照 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 每 维度 对 客户 数 、 销 售 数量 进行 同 
比 、 环 比分 析 。 

维度 层次 结构 : 包括 时 间 、 地 区 、 商 品类 别 和 客户 类 别 。 

e 时 间 : 年 - 季 - 月 。 

e 地 区 : 北京、 上海、 广州、 深圳 。 

e um: 家 电 类 、 电 子 类 、 服 装 类 、 食 品类 。 

e 客户 类 别 : VIP 客户 、 注 册 客 户 、 普 通 客 户 。 

数据 源 : 客户 购买 商品 基本 信息 表 。 

粒度 : 按 月 统计 细节 数据 。 
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16.7.3 ETL 数据 源 说 明 
客户 购买 商品 基本 信息 表 (BOEK) 见 表 16-19。 





表 16-19 客户 购买 商品 基本 信息 表 


名 称 Null (是 否 为 空 ) 描述 
moa | | Y 
| wee | — Y —— | — Ames 
Ewan — |  Xemae | Y 0 iru 
Cust Type Code | Vachg2Q0 | Y | 客户 类 别 编码 
Goods Code O Vaba | Y ——— | 购买 商品 类 别 编码 
Goods Num O Nwe | 购买 商品 的 数量 


16.7.5 ODS 设计 与 抽取 


1. ODS 编码 说 明 
地 区 编码 表 见 表 16-20. 





KIKIKIKIKIKIKIKIZ 











表 16-20 地 区 编码 表 


"EET ETL 转换 说 明 〈 源 系统 的 编码 ) 


101 北京 001 
102 上 海 002 
104 深圳 004 








商品 类 别 编码 表 见 表 16-21。 


表 16-21 商品 类 别 编码 表 


商品 类 别 编 码 商品 类 别名 称 ETL 转换 说 明 ( 源 系统 的 编码 ) 
010 家 电 类 19 
011 电子 类 20 
012 服装 类 21 
013 食品 类 22 








客户 类 列 编 公 表 见 表 16-22. 


表 16-22 客户 类 别 编码 表 


客户 类 别 编 码 客户 类 别名 称 ETL 转换 说 明 ( 源 系统 的 编码 ) 
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2. ODS 表 结 构 说 阴 
ODS 表 结 构 说 明 见 表 16-23. 


表 16-23 ODS 表 结 构 说 明 


名 ^» 字段 类 型 Null (是 否 为 空 ) fü — Ñ 


3. ODS 程序 设计 
ODS 程序 设计 见 表 16-24。 


表 16-24 ODS 程序 设计 


名 W 是 否 主键 ETL 转换 规则 
客户 编码 地 区 编码 + 数据 源 表 .Cust_no 
客户 名 称 | 数据 源 表 .Cust_Name 
地 址 编码 数据 源 表 .Add_Code 
客户 类 别 编码 数据 源 表 . Cust_Type_Code 
购买 商品 类 别 编码 数据 源 表 .Goods_Code 
购买 商品 数量 数据 源 表 .Goods Num 


设计 Mapping 如 图 16-36 PTR: 采用 的 是 全 表 删 除 后 再 进行 数据 加 载 的 方式 。 


LI—E 


CUST BUY. SQ_CUST_BUY_ EXPTRANS 0DS_CUST_BUY_ 
GOODS (Oracle) GOODS GOODS (Oracle) 














图 16-36 Mapping 设计 (一) 


Mapping 展开 后 如 图 16-37 所 示 。 









Sn_CUST_BUY_6000S ar 
Source Qualifier 






fx EXPTRRNS 1 国画 Fr 00s-CUST-BUY-6000s- =- 加 | 加 
Target Def inition 





SQL 


Source Definition 





























































Name Datatype | Name Expression K. Name Datatype | 
~ | Ẹ 1 CUST NO [^| CUST NO string [+| CUST_CODE CUST CODE $ | CUST. CODE varchar] | 
| | [EUST NÀME +| DUST, NAME string +| NAME NAME | NAME varchari | 
| FADD CODE +| ADD CODE string || out add code iif (to cha | ADD CODE varchari | 
|_| IPHONE NUMBER [^| PHONE NUMBER — double || out goodstype iif(to cha | GUST TYPE CODE — varchari | 
|| IUSERS ID NO [^| USERS ID NO string [^| CQUST TYPE ... | GOODSTYPE varchari | 
|| [EMAIL [^| EMAIL string | | out cust t... iif(to cha | GDODSNUM number | | 
|| IUGUST TYPE CODE [^| DUST TYPE ... string +|  GOODSTYPE 
|| 1600DS_CODE +| GOODS CODE string (>|  GODDSNUM GOODSNUM 
|. |. PL GOODS NUM ^| GOODS NUM string ^| ADD CODE 

«[ 四 了 mE EIS 














777777777TTTTTTTTTTTTTTTTTTTTITTTTTTTTOTTT 


图 16-37 Mapping 设计 (二) 
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组 件 的 设计 如 图 16-38 所 示 。 


Edit Transformations 





| EE ej 4 

E Port Hame Datatype| Prec scale|I |olr Expression 
Momo 0o ew I p were 
et p mso —— — — 
NIU mmm E. 7 
LECCE 
a 
ES 
[S 
po | 
|[——J 


xl 


CANIS 
rmammmnpi 


O —— —  |( o ósÓ 
oe qoe 5 p — [n 


diliout goodstrzpe 





a 
E o 
aom 

e E 























JH E 








图 16-38 组 件 的 设计 


其 中 地 址 编码 转换 如 图 16-39 所 示 。 


lil Expression Editor: out add code - EXPTRANS (Expression) 





f liif(to char(ADD CODE)-' 001',' 101, iif (to char 
FM Character (ADD CODE)-' 002',' 102^, iif (to char(ADD CODE) 


-LJ Conversion $ 2 E og > 2 > 
-E Data Cleansing = 009,107 ,iif (to char(ADD CODE)-' 004' , ' 102 )))) 


BL) Date 
LL Humerical 

















图 16-39 地址 编码 转换 
客户 类 别 编 码 转换 如 图 16-40 所 示 。 


ll Expression Editor: out. cust type code - EXPTRANS (Expression) 





: iif(to char(CUST TYPE CODE)-'12','1101', iif 
= ae (to char(CUST TYPE CODE)-' 13,’ 1107 , iif (to char 
| onversion 7 , 9 3 

(CUST TYPE CODE)-' 14, 1103 ))) 


LJ Data Cleansing 














图 16-40 客户 类 别 编码 转换 
购买 商品 类 别 编 码 转 换 如 图 16-41 所 示 。 
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lll Expression Editor: out goodstype - EXPTRANS (Expression) x| 


Functions | Ports | Variables | Formula ġà | | £2 $ B x 


— All Functions iif(to char(GOODSTYPE)-' 19',' 010 ,iif (to char E 
= rms (GOODSTYPE)-" 20° , ° 011°, iif (to, char (GOODSTYPE) 

CI Data Cleansing = 21, 017 ,iif(to_char (GOODSTYPE) =’ 227,’ 013 )))) 
Cg Date 

CJ Numerical 
CJ Scientific 
C3 Special 
Cg Test 

Cg Variables 





EB -FB -EB. -FB.-EB.-EH. -FB. - FB. - EH EH 


Hu 
Functions in the All Functions group. -Numeric keypad— ;-Üperator keypad — — — — — —j 

Ter Enc] Ea] um | oœ | mr | Cancel | 
| sl ml (E | 
1:3 c el SCR rat cat cct Ped| 
LE I "Es mm | 























图 16-41 KA m p ped 


抽取 完成 之 后 ， 数 据 源 表 (CUST BUY GOODS) 16-42 所 示 。 














CUST_NO ICUST_NAHE ADD CODE PHONE NUNEBER USERS ID NO EMAIL CUST_TYPE_CODE GOODS CODE GO00DS_NUE 
1 张 三 001 1 1 111 12 19 10 
B 李 四 001 2 2 222 13 20 15 
3 RA 003 14 21 12 
4 刘 七 002 14 22 10 






































图 16-42 ”数据 源 表 


目标 表 (ODS CUST BUY GOODS) 如 图 16-43 所 示 。 

















CUST CODE NAHE ADD CODE ICUST_TYPE_CODE GOODSTYPE GOODSNUE 
0011 张 三 101 1101 010 10 
0012 李 四 101 1102 011 15 
0033 EE [103 1103 012 12 
0024 Xt (102 1103 013 10 


























图 16-43 目标 表 


16.7.4 ”数据 仓库 (DW) 设计 与 抽取 


1. DW 表 结 构 说 明 
DW 表 结 构 说 明 见 表 16-25. 


表 16-25 DW 表 结 构 说 明 


名 称 字段 类 型 Null (是 否 为 空 ) fü 述 


GoodsType 购买 商品 类 别 编码 
GoodsNum 购买 商品 的 数量 


«l«zi«|z 


| 
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2. DW 程序 设计 
DW 程序 设计 见 表 16-26. 


表 16-26 DW 程序 设计 


购买 商品 类 别 


购买 商品 数量 


GoodsType Varchar2(20) 
[ Gm — | Mme | ON 


- 


Z 


ETL 转换 规则 

当前 月 份 时 间 惟 

ODS 源 表 . Cust Code 

ODS 源 表 . Name 

ODS 源 表 . Add Code 

ODS 源 表 .Cust Type Code 
ODS 源 表 . GoodsType 
ODS 源 表 . GoodsNum 





设计 Mapping 如 图 16-44 所 示 : 抽取 频率 为 一 个 月 一 次 ， 使 用 的 方式 是 全 量 抽取 。 





BED 


ODS CUST BUY. SQ ODS CUST. EXPTRANS 
GOODS (Oracle) BUY. GOODS 


图 16-44 Mapping 设计 (一 ) 


Mapping 展开 后 如 图 16-45 所 示 。 


0DS_CUST_BUY_G00DS... 7 
Source Definition 


Se üDS CUST BUY GOODS ES Fg 


Source Qualifier 


$ | CUST_CODE 
| NAME 


string 
string 
string 
string 
string 


CUST CODE 
NAME 
ADD_CODE 
CUST_TYPE_... 
GOODSTYPE 


| ADD. CODE 
| CUST. TYPE CODE 
| GOODSTYPE 


CUST TYPE ... 
GOODSTYP 


图 16-45 Mapping 设计 (二 ) 


组 件 的 设计 如 图 16-46 所 示 。 


DW_CUST_BUY_ 
GOODS (Oracle) 


r pw cUST. BUY. GOODS ... 


Target Def inition 





| ADD CODE 
| GUST TYPE CODE 
| GOODSTYPE 







































































Edit Transformations B X] 
Transformation Ports | Properties | Metadata Extensions | 
Select [f EXPTRANS 了 | 
Transformation [Expression d ț Bt + 
Port Hame I |O - 
CUST CODE 20 v 
| Ir 
2 Iv ilv 
&4 0 区 区 ADD CODE 
NEÉÓCUST TYPE CODE 20 0 Ia Iris TYPE coDE | 
E -OODSTYPE 20 0 [v [v COODSTYPE 
GCOODSNUM 15 0 Iv [v GCOODSNUM 
El 
Default value: [ERROR ( transformation error’ ) v 
Descripti: A 
zi 








ma | =w | wh | 





图 16-46 组 件 的 设计 
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抽取 完成 之 后 ， 数 据 源 表 (ODS CUST BUY GOODS) 如 网 16-47 所 示 。 
























































CUST CODE NANE ADD CODE CUST TYPE CODE GOODSTYPE GOODSNUE 
0011 张 三 |101 1101 010 10 

0012 李 四 101 1102 011 15 

0033 EH 103 1103 012 12 

0024 刘 七 (102 1103 013 10 

图 16-47 数据 源 表 
目标 表 (DW CUST BUY GOODS) 如 图 16-48 所 示 。 

CUST CODE NANE ADD CODE CUST_TYPE_CODE GOODSTYPE GOODSNUE EON 
0011 张 三 |101 1101 010 10 01 

0012 李 四 |101 1102 011 15 01 

0033 E+ 103 1103 012 12 01 

0024 刘 七 102 1103 013 10 01 


























图 16-48 目标 表 


16.7.5 ”数据 集 市 (DM ) 设计 与 抽取 


1. DM 事实 表 结 构 说 了 明 

主题 描述 : 按照 时 间 、 地 区 、 商 品 
环比 比较 (例如 1 月 和 2 月 的 比较 )， 

维 : 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 。 

HE: 客户 购买 商品 的 数量 。 


关 别 、 客 户 关 别 统 计 客 户 购买 商品 的 数量 ， 并 且 进 行 





数据 源 : DW CUST BUY GOODS. 
主题 名 称 : 按 月 统计 客户 购买 商品 情况 分 析 。 


DM 事实 表 结 构 说 明 见 表 16-27. 


表 1627 DM 事实 表 结 构 说 明 


Mon Varchar2(20) 


月 份 


— x — 
N 


2. DM 维 表 结构 说 明 
维 表 的 数据 直接 从 ODS 编码 表 采 用 增 量 
地 区 维 表 如 图 16-49 所 示 。 





的 方式 进行 抽取 。 
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WEIS Code Data Type Primary ETL 转 换 规 则 
地 区 编码 DistrictCode varchar2(20) yes 0D$ 地 区 编码 表 的 编码 字段 


地 区 名 称 DistrictName ^  Varchar2(400) no oD$ 地 区 编码 表 的 名 称 字段 





图 16-49 地 区 维 表 
商品 类 别 维 表 如 图 16-50 所 示 。 


Ell Code DataType Primary ETL 转 换 规则 
品类 别 编码 GoodsCode Varchar2(20) yes 0DS 商 品类 别 编码 表 的 编码 字段 


商品 类 别名 称 ^ GoodsName Varchar2(400) no 0DS 商 品类 别 编码 表 的 名 称 字段 








图 16-50 ”商品 类 别 维 表 
客户 类 别 维 表 如 图 16-51 所 示 。 


Name Code Data Type primary ETL 转 换 规则 
客户 类 别 编码 。 QustTypeCode —— Varchar2(20) yes ODS 客户 类 别 编码 表 的 编码 字段 


客户 类 别名 称 “CustTypeName — Varchar2(400) no 0DS 客 户 类 别 编码 表 的 名 称 字段 





图 16-51 客户 类 别 维 表 


3. DM 程序 设计 
DW 的 物理 模型 如 图 16-52 所 示 。 







FK AKIE PHI REFERENCE EP E EE 


FK ARIE HE AEFERENCE WAER 
EARHE PALARI A 


FAASIS HL_REFERENCE HAZIA 


图 16-52 DM 的 物理 模型 
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设计 Mapping 如 图 16-53 所 示 : 抽取 频率 为 一 个 月 一 次 ， 使 用 的 方式 是 全 量 抽取 。 


DW CUST BUY . SQ DW CUST _ AGGTRANS DM CUST BUY- 
GOODS (Oracle) BUY G00DS GOODS (Oracle) 





图 16-53 Mapping 设计 (一) 


Mapping 展开 后 如 图 16-54 Bn. 


mes TUY GOODS ... 回回 $0 DM CUST BUY GÜODS EQ e | | T DETIENE T 
E Source Definition Be Source Mualifier Agg li Tarvet Definition 
j ; 


Express HN 
[5 


- | | CUT. CODE DUST. DODE 
| NAME NAME 3 
| ADD. CODE ADD. CODE | Mii | DISTRICTCODE 
| CUST TTPE CODE CUST TIPE CODE GOODSTYPE i | GOCODSCODE 
| GOCODSTTPE GOBDSTIR | GOODENUN | CUSTTYPECODE 





K|16-54 Mapping ixit (—) 


16.8 kx L^ 


1) ETL 是 数据 抽取 (Extract)、 转 换 (Transform)、 加 载 (Load) HJf8]*3. EHF f E^ 
商业 智能 项 目 ， 是 构建 数据 仓库 最 重要 的 一 步 。 系 统 通 过 ETL 过 程 将 数据 源 中 的 数据 经 过 转 
换 和 整合 加 载 到 数据 仓库 中 。 

2) ETL 的 框架 结构 包含 了 业务 数据 源 、ODS 数据 缓冲 区 、ODS 统一 信息 视图 区 、 数 据 
仓库 、 数 据 集 市 等 内 容 。 

3) ETL 的 流程 包含 了 从 源 数据 抽取 到 ODS 数据 缓冲 区 、 从 ODS 数据 缓冲 区 抽取 到 
ODS 统一 信息 视图 区 、 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 、 从 数据 仓库 抽取 到 数据 集 
市 的 过 程 。 

4) ETL 的 加 载 方法 有 4 种 。 

e 以 时 间 蕉 作为 加 载 数据 的 条 件 。 

e 利用 源 表 的 日 志 信 息 对 目标 表 进 行 数据 加 载 。 

e 通过 全 表 对 比 的 方式 进行 数据 加 载 。 

e 全 表 删 除 后 再 进行 数据 加 载 。 

5) ETL 的 设计 过 程 : 数据 源 和 ODS 之 间 的 对 应 ，ODS 和 数据 仓库 之 间 的 对 应 ， 数 据 仓 
库 和 数据 集 市 之 间 的 对 应 。 

6) ETL 数据 质量 改进 的 困难 体现 在 : 数据 量 较 大 ， 数 据 类 型 不 统一 ， 数 据 质 量 没有 一 个 
清晰 明确 的 标准 和 定义 。 系 统 的 改造 和 升级 或 者 是 人 为 因素 ， 都 可 能 导致 数据 的 混乱 。 
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7) 在 进行 ETL AMENT, mAT EE, JScEEVA SS E 2 1 X 
AMEk. HURAE REET AR 2E DP RR EI] RD ERNE — PE, RIELS, enu 
过 滤 系 统 的 垃圾 数据 ， 建 立 人 工 映 射 表 去 统一 和 匹配 编码 不 一 致 的 部 分 数据 。 

8) ETL 数据 质量 主要 从 技术 层面 、 管 理 层 面 、 业 务 层 面 等 角度 去 分 机 和 改进 。GD 从 技 
术 层 面 来 说 ， 需 要 对 源 数据 进行 清洗 ， 以 过 波 邱 垃圾 数据 和 存在 不 一 致 性 的 数据 ， 同 时 需要 
对 庆 数 据 的 质量 进行 评 佑 ， 然 后 根据 业务 实际 情况 设计 出 完整 的 数据 质量 改进 方案 。@) 从 管 
理 层面 来 说 ， 我 们 应 该 切实 你 证 从 业务 系统 源 数据 到 数据 集 市 中 各 个 环节 的 数据 的 正确 性 、 
一 任性 和 完整 性 。(3) 从 业务 层面 来 说 ， 对 源 数据 的 抽取 需要 遵循 相应 的 业务 规则 ， 将 ETL 
的 过 程 流程 化 、 规 范 化 。 

9) ETL 的 功能 包括 : 数据 抽取 (Extract) 、 转 换 (Transform) 、 清 洗 (Cleansing) ~ JE 
载 (Load) 。 它 是 构建 数据 仓库 的 重要 一 环 ， 用 户 从 数据 源 抽 取出 所 需 的 数据 ， 经 过 数据 清 
洗 ， 最 终 按 照 预先 定义 好 的 数据 仓库 模型 ， 将 数据 加 载 到 数据 仓库 中 去 。 

ETL 475] zÆ "Extract" "Transform" "Load" =P AWWA FRS, E EE oS A 
25 39 i I8] Hb Gs FPE PRI SERE. 

ETL 包含 了 三 方面 ， 将 数据 从 业务 系统 中 该 取出 来 。 按 照 了 预先 设计 好 的 规则 将 抽取 得 数 
据 进行 转换 ， 使 本 来 寞 构 的 数据 格式 能 集成 起 来 。 最 后 将 转换 完 的 数据 按 增 量 或 全 量 装 载 到 
数据 仓库 中 。 

一 般 来 说 ，ETL 工具 可 转换 和 衍生 各 种 丰富 信息 ， 以 确保 可 以 将 数据 放 在 适当 的 上 下 文 
环境 中 用 于 新 用 途 。 各 种 转换 功能 可 结合 、 改 造 并 汇聚 信息 。 
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第 17 卫 联机 分 析 处 理 


本 章 目 标 
D 通过 本 章 的 学 习 ， 理 解 OLAP 的 基本 概念 。 
2) 通过 学 习 OLAP 实施 的 一 般 过 程 ， 掌 握 OLAP 的 实施 方法 。 





3) 通过 学 习 OLAP 系统 设计 的 一 般 步 线 ， 掌 握 OLAP 系统 设计 的 方法 。 


学 习 本 章 后 ， 您 将 掌握 : 

© OLAP 的 基本 概念 。 

@ OLAP 的 实施 过 程 。 

e 什么 是 多 维 分 析 。 

€ OLAP 系统 设计 的 一 般 步 又 。 


17.1 OLAP 的 概念 





OLAP《〈 联 机 分 析 处 理 ) 是 根据 用 户 特殊 的 需求 而 进行 的 联机 数据 分 机， 包括 对 数据 仓库 
的 分 析 ， 是 业务 分 析 人 员 、 中 层 管 理 人 员 、 企 业 领 导 者 从 多 角度 对 企业 数据 进行 深入 理解 的 
一 类 技术 。 





11.2 OLAP 的 实施 


17.2.1 建立 “ 维 ” 的 概念 


理论 篇 已 经 大 致 介绍 了 OLAP 的 理论 知识 ， 下 面 将 从 项 目的 角度 介绍 OLAP 的 实施 过 
程 ， 首 先 用 维度 去 思考 周围 的 现实 世界 。 举 一 个 盏 火 商 销售 的 例子 ， 苗 火 商 销售 一 般 考 虑 的 
是 销售 额 、 销 售 的 成 本 和 利润 。 表 17-1 是 一 张 典 型 的 三 维 数据 表 ， 其 中 月 份 束 是 一 个 关键 的 











表 17-1 二 维 数 据 表 


~1| CIwmw| 下 |mlP | 一 


利 


800 
1050 
700 
900 
900 
1000 
1200 


ili 
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WREX — ERE EEK, PS LACSEZE PIS s DriB LUI Vs. GL 
是 多 维度 和 度量 值 组 成 的 逻辑 结构 ， 如 图 17-1 所 示 。 

在 图 17-1 中 ， 可 知 该 立方 体 的 维度 是 月 份 和 销售 军火 的 类 别 ， 度 量 值 是 销售 额 、 成 本 、 
利润 。 引 入 了 以 下 概念 : 维度 、 维 度 的 层次 、 类 别 、 度 量 。 

维度 : 用 来 对 数据 进行 分 类 的 结构 和 人 们 观察 业务 情况 的 角度 。 

维度 的 层次 : 根据 维度 细节 程度 的 不 同 ， 划 分 出 来 的 一 类 属性 ， 是 维度 中 预先 定义 的 不 
同 级 别 。 例 如 ， 日 期 维度 的 层次 包括 年 、 月 、 日 。 

类 别 : 是 维度 上 各 层次 的 数据 项 取 值 。 例 如 ， 日 期 维度 中 层次 月 的 类 别 有 : 1 月 、2 月 、 
3 月 等 ， 如 图 17-2 所 示 。 

gpt 





























=T 
=f 
I 


V 








= 
N 
GN 
UJ 
a 
A 
am 


图 17-1 立方 体 图 17-2 类别 


度量 : 用 来 描述 业务 情况 的 数值 型 数据 ， 存 储 的 是 多 维 数据 。 例 如 ， 销 售 额 、 销 售 的 成 
本 和 利润 都 是 度量 值 ， 度 量 值 乙 间 都 是 相互 独立 的 。 


17.2.2 多维 分 析 技 术 


多 维 分 析 是 以 多 维 的 形式 组 织 数据 ， 并 且 采 用 切片 、 切 块 、 钻 取 、 旋 转 等 多 种 分 析 方 式 
探查 数据 ， 使 分 析 人 员 或 者 管理 人 员 能 够 从 多 方面 、 多 角度 去 查询 数据 ， 从 而 得 到 有 价值 的 
信息 。 读 者 需要 理解 以 下 几 个 概念 : 

7EXE (Drill Through): 是 对 详细 信息 的 钻 取 。 例 如 ， 可 以 通过 单 击 军 火 的 名 称 进 入 到 它 
的 详细 信息 页 面 ， 如 图 17-3 PR. 























序号 ”军火 名 称 EE 
















运输 直升机 cH 一 47 15.54% 3.782% ”5.68 米 


1 直升机 


图 17-3 FANT 





上 外 (Drill-Up): 在 维度 中 从 细 到 粗 展 示 数 据 ， 从 而 变换 分 析 的 粒度 。 例 如 在 “月 ” 维 
中 可 以 上 钻 到 它 的 上 一 级 “年 ”， 如 图 17-4 Bran. 
下 钻 (Drill-Down): 在 维度 中 从 粗 到 细 展 示 数 据 ， 从 而 变换 分 析 的 维度 。 例 如 在 “年 ” 
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维 中 可 以 下 锁 到 它 的 下 一 级 “月 ”， 如 图 17-5 所 示 。 


月 份 WEM 成 本 AH 年 WEM 成 本 AW 





1 2000 1200 800 2011 24000 20000 29800 


图 17-4 ”上 和 钻 例子 


月 份 HEM 。 成 本 利润 


1 2000 1200 800 
2 2400 1350 1050 
年 HEM 成 本 利润 
= 3 1500 800 700 
2011 24000 20000 9800 4 1900 1000 900 
5 2100 1200 900 
6 2300 1300 1000 


T 2500 1300 1200 





图 17-$ 下 钻 例子 


切片 〈Slice): 在 维 上 选 定 值 后 ， 列 出 这 个 范围 内 的 数据 。 例 如 在 图 17-6 中 ， 可 以 得 到 
军火 类 别 维 (军用 卡车 、 普 通 步 兵 枪 、 坦 元 、 火 第 位、 直升机 )， 日 期 维 (1 HO 的 销售 额 、 
成 本 、 利 润 情 况 。 

W (Dice): 切 块 是 在 切片 的 基础 上 ， 在 维 上 选择 的 值 是 一 个 区 间 ， 然 后 列 出 这 个 范围 
内 的 所 有 值 ， 这 个 区 间 的 值 多 于 两 个 。 

例如 在 图 17-7 中 ， 可 以 得 到 车 火 次 别 维 〈 和 军用 卡车 、 普 通 步 兵 枪 、 坦 区 、 火 区 简 、 下 升 
HO, HWE (1H. 2H. 3 Ho 的 销售 额 、 成 本 、 利 洞 情况 。 
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图 17-6 切片 图 17-7 Wu 
旋转 (Pivot): 类 似 于 行列 互 换 ， 通 过 改变 维度 的 方向 重新 安排 表格 的 摆 放 形式 。 例 如 ， 
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表 17-2 经 过 旋转 变 为 表 17-3 形式 。 
表 17-2 表格 一 


销售 额 1100 1300 u 1500 1300 1400 1500 1500 


Xx 17-3 表格 二 
2010 年 
2011 年 


17.2.3 OLAP 实施 的 一 般 过 程 


(1) 需求 阶段 

需求 分 析 包 括 通过 调研 得 出 的 业务 需求 (从 维度 、 各 业务 的 分 析 主 题 等 方面 进行 摘 述 )、 
性 能 需求 〈 系 统 啊 应 时 间 的 要 求 )、 技 术 需 求 〈 例 如 系统 建立 在 Cognos 平台 基础 上 ， 
Informatica 作为 ETL 的 工具 )、 和 安全 性 需求 和 需求 的 优先 级 等 内 容 。 在 需求 阶段 ， 我 们 应 访 
积极 主动 地 与 客户 联系 ， 明 确 OLAP 系统 的 实现 内 容 。 在 通常 情况 下 ， 客 户 也 会 逐渐 谭 悉 数 
据 仓 库 系 统 、OLAP 系统 的 功能 ， 了 解 相关 的 数据 仓库 产品 知识 ， 同 时 也 是 我 们 熟悉 相关 业 
务 知 识 的 过 程 。 

(2) 规划 阶段 

在 需求 分 析 的 基础 上 上 ， 需 要 对 项 目的 整体 结构 有 一 定 的 了 解 ， 投 照 软件 工程 的 一 般 规 则 
和 方法 规划 整个 项 目的 过 程 。 同 时 需要 确定 整个 项 目 需要 的 资源 ， 包 括 多 少 人 力 ， 做 哪些 相 
关 的 培训 等 内 容 。 

(350 WW EC 

设计 阶段 是 整个 OLAP 项 目 最 重要 的 阶段 ， 包 括 对 模型 的 分 机 、OLAP 维度 的 分 机 和 设 
计 、 事 实 表 的 设计 等 内 容 。 模 型 的 分 析 包 括 定义 问题 和 确定 分 析 的 目标 和 内 容 ，OLAP 可 以 
解决 哪些 重要 的 问题 ， 例 如 军火 丙 全 年 销售 的 直升机 利润 总 额 是 多 少 ， 销 售 火箭 简 在 1 月、2 
月 、3 月 消耗 的 成 本 是 多 少 等 内 容 。OLAP 维度 的 分 析 包 括 分 析 问 题 中 所 涉及 的 维度 是 哪些 
每 个 主题 中 维度 和 度量 值 是 多 少 。 例 如 ， 军 火 商 销 售 军火 情况 主题 束 涉 及 军火 类 别 、 日 期 两 
个 维度 ， 如 图 17-8 所 示 。 和 人 军火 类 别 维度 包括 车 用 卡车 、 普 通 步 兵 枪 、 坦 元 、 火 荫 和 位、 直升机 ， 
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而 日 期 维度 包含 一 年 当中 的 12 个 月 。 
HER 


High varchar2(20) Xpk? 
RBZ varchar2(20) 





军火 编码 varchar2(20) 
军火 名 称 varchar2 TE e 
N j 
FK_ 军 淡 商 销售 军火 情 REFERENCE S. 军火 商 销售 军火 情 REFERENCE _ 日 期 维 表 


/ 


/ 
/ 


y 


3E sk $3 883 ES E. SX Ir odes 
varchar2(20) <pk> 
B varchar2(20) 《fkl> 


编码 varchar2(20) 《fk2> 
varchar2(20) 
varchar2(20) 
varchar2(20) 





图 17-8 物理 模型 设计 


(4) 构建 模型 阶段 

根据 业务 的 需求 确定 需要 分 析 的 主题 ， 根 据 分 析 的 主题 确定 分 析 的 粒度 和 度量 值 ， 
分 析 的 维度 。 例 如 ， 皇 火 商 销售 苗 火 情况 信息 主题 主要 从 军火 类 型 、 日 期 维度 两 方面 进行 
析 。 最 后 测试 和 验证 模型 的 正确 性 。 

(5) 报表 展现 阶段 

在 报表 展现 阶段 ， 可 以 利用 成 熟 的 报表 展示 工具 (例如 Cognos)， 在 模型 的 基础 上 对 主 
题 进行 多 角度 的 分 析 ， 最 后 进入 到 报表 的 测试 阶段 和 运行 验收 阶段 。 

OLAP 实施 的 一 般 过 程 如 图 17-9 所 示 。 


u 
Y 
A 


OLAP 实 施 的 一 般 过 程 ， 
。 需 求 阶段 
。 规划 阶段 
。 设 计 阶 段 
。 构 建 模型 阶段 
。 报 表 展现 阶段 





























图 17-9 OLAP 实施 的 一 般 过 程 
17.3 OLAP 的 应 用 实例 


17.3.1 案例 背景 
对 军火 商 的 销售 情况 进行 数据 分 析 。 在 数据 库 中 存在 3 张 表 : 军火 商 销 售 军火 情况 信息 
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表 、 日 期 维 表 、 和 军火 类 型 维 表 。 
17.3.2 ”需求 


作为 军火 销售 的 决策 者 ， 最 关注 的 信息 就 是 2010 年 和 2011 年 军火 销售 的 情况 ， 包 括 军 
火 销售 额 、 销 售 成 本 、 利 润 。 为 了 考察 车 火 销售 的 趋势 ， 决 策 者 布 望 看 到 销售 额 、 销 售 成 本 、 
利润 按照 日 期 或 者 军火 类 型 划分 的 分 布 情况 。 决 策 者 通过 日 期 、 盏 火 类 型 等 儿 个 方面 分 析 销 
售 情 况 ， 为 以 后 的 决策 提供 辅助 文 持 。 

1. 分 析 的 主题 

军火 商 销售 军火 情况 信息 主题 。 

2. 分 析 的 事实 

销售 额 、 销 售 成 本 、 利 润 。 

3. 分 析 的 角度 

日 期 、 匣 火 类 型 。 

4. 分 析 的 粒度 

日 期 : H. 

S. 数据 的 分 析 

D 不 同类 型 车 火 的 销售 情况 。 

2) 军火 销售 按照 时 间 的 分 布 情况 。 

3) 通过 不 同 的 军火 类 型 、 日 期 两 个 方面 分 析 军 火 销售 的 情况 。 


17.3.3 ”数据 准备 


(1) 维 表 的 数据 
军火 类 型 维 表 见 表 17-4. 

















表 17-4 军火 类 型 维 表 


军火 编码 军火 名 称 军火 编码 军火 名 称 


日 期 维 表 见 表 17-5. 


表 17-5 日 期 维 表 
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(BE) 


日 期 编码 月 份 名 称 日 期 编码 月 份 名 称 


(2) 事实 表 的 数据 
军火 商 销 售 军火 情况 信息 表 见 表 17-6. 











表 17-6 军火 商 销 售 军火 情况 信息 表 


oO[oo|-|o 
mÓ 
© 
© 
| 
m 
N 
起 
© 
© 
LA 
© 
© 


17.3.4 WETA 


在 完成 需求 分 析 和 数据 装载 之 后 ， 进 行 多 维 数据 集 的 分 析 。 下 面 以 Cognos 作为 BI CA 
业 智 能 ) 展示 工具 举例 如 下 : 

(1) 构建 数据 模型 

使 用 Framework Manager 工具 构建 数据 模型 并 且 发 布 ， 如 图 17-10 所 示 。 











图 17-10 构建 数据 模型 


(2) 数据 分 析 展 示 
军火 商 销 售 军 火 情况 信息 如 图 17-11 PR. 
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B5 军火 名 称 HEM A 


01 军用 卡车 2000 1200 800 
普通 步兵 枪 900 400 500 
01 2900 1600 1300 
02 FAFE 2400 1350 1050 
坦克 750 500 250 
02 3150 1850 1300 
03 军用 卡车 600 300 300 
坦克 1500 800 700 
03 2100 1100 1000 
04 Aate 1900 1000 900 
普通 步兵 枪 1000 750 250 
坦克 2100 1500 600 
04 5000 3250 1750 
05 军用 卡车 500 300 200 
直升机 2100 1200 900 
05 2600 1500 1100 
06 普通 步兵 枪 2300 1300 1000 
06 2300 1300 1000 
07 普通 步兵 枪 1900 1500 400 
坦克 2500 1300 1200 
07 4400 2800 1600 
Summary 22450 13400 9050 








图 17-11. 军火 商 销售 军火 情况 信息 





17.4 OLAP 系统 设计 的 一 般 步 又 


(1) 对 OLAP 系统 环境 的 描述 

包括 OLAP 系统 的 数据 库 环境 (例如 Oracle 10g), OLAP 系统 使 用 的 应 用 服务 器 平台 ( 例 
如 Cognos 8.3)， 运 行 环境 (例如 Java JDK 1.4 UE), HAERA ilin Microsoft Windows XP 
Service Pack 3)， 应 用 系统 开发 环境 (例如 Eclipse 3.2)， 开 发 语言 (例如 Java) 等 内 容 。 

(2) 维度 和 度量 的 设计 

维度 设计 包括 维度 名 称 、 层 次 、 成 员 和 属性 等 要 素 ， 一 般 需 要 描述 维度 各 目的 特性 ， 例 
如 维度 的 变化 情况 〈 固 定 维度 、 维 度 绥 慢 变 化 和 维度 快速 变化 3 种 情况 )、 生 成 新 的 维度 代理 
键 ， 新 维度 的 生成 情况 《将 不 同 的 分 析 角 上 度 进 行 合 并 ， 形 成 新 的 维度 ) 等 内 容 。 上 度量 的 设计 
一 般 包 括 上 度量 的 名 称 、 必 性、 粒度 等 内 容 。 

(3) 维度 模型 的 设计 

维度 模型 包含 两 种 不 同性 质 的 表 : 事实 表 和 维度 表 ， 如 图 17-12 所 示 。 其 中 事实 表 是 模 
型 的 核心 表 ， 包 售 两 个 或 者 两 个 以 上 的 外 键 关键 字 ， 它 连接 到 相应 的 维度 表 的 主键 上 上。 维度 
表 包 售 关 键 字 、 属 性 列 ， 它 提供 了 数据 分 析 的 角度 。 

其 中 维度 表 采 用 代理 关键 字 时 间 D, WX ID. F ID. ri ID EV URSUS BET. e 

为 了 使 数据 仓库 中 的 维度 信息 与 源 系统 的 信息 对 应 起 来 ， 也 会 将 源 系 统 的 关键 学 存储 在 
维度 表 中 。 例 如 ， 时 间 维 度 表 中 的 时 间 编 码 就 是 从 源 系 统 中 直接 抽取 出 来 的 ， 访 时间 编 码 包 
含 了 年 、 季 、 月 的 信息 ， 将 这 些 信息 从 源 系 统 中 抽取 出 来 ， 经 过 转换 变 成 年 、 季 、 月 3 个 时 
间 属 性 提供 给 时 间 维 度 表 。 维 度 表 可 以 进行 层次 化 的 处 理 ， 例 如 时 间 维 度 包 含 了 年 、 季 、 月 3 
个 层次 。 同 时 ， 维 度 表 又 对 访 属 性 值 进行 了 处 理 ， 例 如 在 源 系 统 中 对 客户 类 型 会 采用 编码 的 
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形式 进行 存储 ， 而 在 维度 表 中 用 本 来 的 含义 去 替代 编码 ， 例 如 客户 类 型 : VIP 客户 、 注 册 客 
PM x38 2) Y ERRA V. Z. P. 


时 间 维 度 客户 维度 


时 间 ID varchar2140) ; 客户 ID varcharzi40) 

时 间 编 码 varchar2(40) \ / 客户 类 型 varchar2l40| 

\ /| 二 vertharauo) 

A EP e ps / 电子 邮箱 varchar2140) 
| 


| 
人 


地 区 ID  varcharzt40) V 过 商品 D varchar2l40) 


地 区 名 称 varcharzi4O) 商品 名 称 varchar2(40) 





图 17-12 ”维度 模型 的 设计 


OLAP 系统 设计 的 一 般 步 又 如 图 17-13 所 示 。 


对 OLAP 系 统 维度 和 度量 维度 模型 


图 17-13 OLAP 系统 设计 的 一 般 步 又 


11.5. zx 


1) OLAP《 联 机 分 析 处 理 ) 是 根据 用 户 特殊 的 需求 而 进行 的 联机 数据 分 析 ， 包 括 对 数据 
仓库 的 分 析 ， 是 业务 分 析 人 员 、 中 层 管理 人 员 、 企 业 领 导 者 从 多 角度 对 企业 数据 进行 深入 理 
解 的 一 类 技术 。 

2) 维度 : 用 来 对 数据 进行 分 类 的 结构 和 人 们 观察 业务 情况 的 角度 。 

3) 多 维 分 析 是 以 多 维 的 形式 组 织 数据 ， 并 且 采 用 切片 、 切 块 、 钻 取 、 旋 转 等 多 种 分 析 方 
式 探查 数据 ， 使 分 析 人 员 或 者 管理 人 员 能 够 从 多 方面 、 多 角度 去 查询 数据 ， 从 而 得 到 有 价值 
的 信息 。 

4) 穿 透 (Drill Through): 是 对 详细 信息 的 钻 取 。 

5) Ef (CDrill-Up): 在 维度 中 从 细 到 粗 展示 数据 ， 从 而 变换 分 析 的 粒度 。 

60 下 外 (Drill-Down): 在 维度 中 从 粗 到 细 展 示 数 据 ， 从 而 变换 分 析 的 维度 。 

7) 切片 (Slice): 在 维 上 选 定 值 后 ， 列 出 这 个 范围 内 的 数据 。 

8) 切 块 (Dice): 切 块 是 在 切片 的 基础 上 ， 在 维 上 选择 的 值 是 一 个 区 间 ， 然 后 列 出 这 个 
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范围 内 的 所 有 值 ， 这 个 区 间 的 值 多 于 两 个 。 

9) 旋转 (Pivot): 类 似 于 行列 互 换 ， 通 过 改变 维度 的 方向 重新 安排 表格 的 摆 放 形式 。 

100 OLAP 的 实施 过 程 包括 : 需求 阶段 、 规 划 阶 段 、 设 计 阶 段 、 构 建 模型 阶段 、 报 表 展 
现 阶 段 。 

11) 设计 阶段 是 整个 OLAP 项 目 最 重要 的 阶段 ， 包 括 对 模型 的 分 机 、OLAP 维度 的 分 析 
和 设计 、 事 实 表 的 设计 等 内 容 。 

12) 根据 业务 的 需求 确定 需要 分 析 的 主题 ， 根 据 分 析 的 主题 确定 分 析 的 粒度 和 度量 值 ， 
包括 分 析 的 维度 。 

13) OLAP 系统 设计 的 一 般 步 又 包括 : 对 OLAP 系统 环境 的 描述 、 维 度 和 度量 的 设计 、 
维度 模型 的 设计 。 
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185€ 应 用 举例 


本 章 目标 

本 章 通 过 一 个 傈 单 的 营销 系统 和 案例， 描述 了 商业 智能 项 目 开发 的 整体 流程 ， 包 括 项 目 计 
划 的 制订 、 需 求 分 机 、 宫 销 系统 设 计 、ETL 数据 抽取 、 报 表 展 示 等 内 容 。 这 也 是 对 理论 篇 和 
项 目 篇 内 容 的 一 个 总 结 。 

FASE., KKE: 

e 如 何 制 订 项 目 工作 计划 。 

@ 如 们 进行 需求 分 析 。 

e 如 何 进行 企业 数据 概念 醒 型 建设 。 

e 如 何 进行 企业 数据 逻辑 柑 型 建设 。 

e 如 何 进行 数据 仓库 物理 模型 建设 。 


18.1. 项 目 工 作 计 划 的 制订 





18.1.1 对 项 目 背 景 与 日 的 的 描述 


项 目 背 景 主要 包括 现 有 的 信息 系统 ， 每 个 信息 系统 的 业务 需求 ， 各 个 信息 系统 建立 的 时 
期 ， 每 个 信息 系统 建立 时 采用 的 数据 模型 。 例 如 ， 和 营销 系统 是 不 同 的 省 、 市 地 区 建立 的 相对 
独立 的 信息 系统 ， 采 用 的 数据 模型 也 大 多 是 系统 供应 商 根据 不 同 的 业务 需求 而 设计 出 来 的 。 
因为 相对 独立 的 信息 系统 缺乏 统一 的 设计 和 规划 ， 它 们 有 各 目的 标准 和 业务 需求 ， 这 就 造成 
了 企业 数据 存在 不 统一 性 和 分 知性 ， 每 个 业务 系统 之 间 不 能 实现 信息 的 共 至 和 交互 ， 对 企业 
有 效 利用 数据 资源 造成 了 极 大 的 困难 。 为 了 实现 数据 资源 的 有 效 利用 ， 企 业 需 要 建立 统一 的 
数据 模型 ， 实 现 企业 信息 资源 的 共享 ， 为 企业 的 业务 分 析 和 决策 支持 带 来 方便 ， 这 就 是 项 目 
建设 的 根本 目的 。 

对 项 目 背 景 和 目的 的 描述 有 利于 项 目 成 员 和 
项 目 干 系 人 达成 共识 ， 使 项 目 成 员 了 人 解 项 目的 相 | 
天 情况 和 各 项 任务 ， 明 确 项 目的 服务 对 象 和 系统 Le 不同 信 息 系统 的 业 
使 用 后 应 该 达到 的 效果 等 内 容 ， 如 图 18-1 所 示 。 | 务 需求 






























| e 实现 数据 资源 的 有 效 
利用 
. 实现 信息 资源 的 共 








。 各 个 信息 系统 建立 * 

e cp Zx My > 的 时 期 。 为 企业 的 业务 分 析 

18.1.2 ”人 硝 定 项 目击 要 交付 的 成 末 。 每 个 信息 系统 建立 和 决策 支持 带 来 广 
时 采用 的 数据 模型 | | om 





数据 仓库 项 目 需 要 交付 的 成 果 主 要 包括 以 下 
几 个 部 分 ， 如 网 18-2 所 示 。 

D 在 对 现 有 应 用 系统 分 析 的 基础 上 , 提交 摘 
述 数据 现状 分 析 的 文档 。 文 档 内 容 主要 包括 主要 
业务 现状 〈 例 如 ， 营 销 系统 的 主要 业务 现状 包括 它 的 管理 模式 和 业务 措 述 )， 主 要 业务 数据 现 
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图 18-1 项 目 背景 与 目的 的 摘 述 











Ak CBA, KEKE, OEURBMGETM AO. ARTIA. 
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图 18-2 ”数据 仓库 项 目 需要 区 付 的 成 东 


2) 数据 概念 模型 说 明文 档 。 
3) 数据 逻辑 模型 框 染 文档 和 有 关 主 题 的 数据 逻辑 模型 的 说 明文 档 。 
4) ODS、 数 据 仓 库 模 型 设计 说 明 书 和 数据 集 市 设计 说 明 书 。 


18.1.3 制定 项 目 管 理 文档 项 目 计划 书 
项 目 管理 文档 如 图 18-3 所 示 。 


(1) 项 目 计 划 书 
项 目 计 划 书 是 项 目 成 员 和 项 目 干 系 人 了 解 项 目的 


桥梁 ， 项 目 开 发 团队 就 是 通过 项 目 计划 书 开展 项 目 设 [一 一 一 一 一 | | 


计 、 开 发 等 工作 ， 项 目 管理 者 也 是 通过 项 目 计划 书 开 
展 对 项 目的 监督 和 管理 方面 的 工作 。 项 目 计 划 书 包含 图 18-3 WHEE 
的 内 容 可 以 是 项 目 团队 的 组 织 结构 、 项 目 各 成 员 的 工作 任务 和 职责 、 项 目 工作 的 任务 分 解 、 
项 目的 经 费 预算 等 。 

(22 会 议 纪要 模板 

会 议 纪要 的 内 容 主要 包括 会 议 主 题 、 会 议 时 间 、 会 议 地 点 、 会 议 主持 人 、 参 会 人 
议 纪 要 等 ， 如 图 18-4 所 示 。 

(3) 项 目 周报 模板 

项 目 周报 的 主要 内 容 包含 项 目 总 体 的 进展 情况 ， 例 如 项 目的 当前 进度 和 成 果 ， 本 周 主要 
完成 了 哪些 工作 、 完 成 的 情况 如 何 ， 在 项 目 设计 开发 过 程 中 出 现 了 哪些 问题 、 问 题 的 解决 方 
案 是 什么 ， 下 周 的 主要 工作 有 哪些 ， 如 图 18-5 所 示 。 这 些 内 容 都 可 以 反映 到 项 目 周报 中 ， 从 
而 使 项 目 管理 者 及 时 了 解 项 目的 进展 情况 和 人 员 的 工作 情况 等 信息 。 
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工作 周报 


总 体 进展 情况 : 
项 目的 当前 进度 和 成 果 是 什么 ? 
本 周 主要 完成 了 哪些 工作 、 完 成 的 情况 如 何 ? 


项 目 存 在 哪些 问题 及 解决 方案 是 什么 ? 
下 周 主 要 工作 有 哪些 ? 





图 18-4 ”会议 纪要 模板 图 18-5 项 目 周报 模板 


18.1.4 项 目 进度 划分 
项 目 进 度 划 分 见 表 18-1。 其 中 调研 过 程 可 以 分 成 以 下 几 个 步骤 ， 如 网 18-6 所 示 。 


表 18-1 项 目 进度 划分 


工作 任务 项 目 结束 时 间 所 需要 的 资源 备注 信息 
—— 
概念 模型 设计 、 汇 报 模型 设计 人 员 
概念 模型 评审 业务 系统 专家 
Ad 


制订 调研 调研 计划 的 针对 不 同人 
计划 实施 员 的 调研 


图 18-6 调研 过 程 


(1) 制订 调研 计划 

确定 调研 目标 、 调 研 人 员 和 组 织 。 

(2) 对 调研 计划 的 实施 

主要 包括 会 议 访谈 和 问卷 调查 两 种 方式 。 

(3) 针对 企业 高 层 领导 的 调研 

了 解 现 阶段 企业 工作 的 重点 ， 领 导 高 层 最 关心 哪些 指标 、 对 数据 仓库 的 期 望 ， 分 析 领 导 
关心 的 领域 与 哪些 主题 域 相关 。 

(A). 针对 企业 管理 人 员 的 调研 

了 解 企 业 管 理 人 员 最 关心 的 指标 有 哪些 ， 管 理 人 员 、 考 核 下 属 职工 的 指标 与 哪些 主题 域 
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相关 ， 管 理 人 员 和 希望 数据 仓库 能 够 提供 哪些 有 价值 的 分 析 功 能 。 
C5) 针对 业务 人 员 的 调研 
了 解 业 务 人 员 最 关心 的 指标 有 哪些 ， 业 务 人 员 和 希望 数据 仓库 能 够 提供 哪些 分 析 功 能 。 
C60 针对 I 技术 人 员 的 调研 
了 解 IT 技术 人 员 最 关心 的 指标 有 哪些 ，IT 技术 人 员 希 望 数据 仓库 能 够 提供 哪些 分 析 功 
能 ， 业 务 系统 的 数据 刷新 频 座 是 多 少 。 


18.2 需求 分 析 




















18.2.1 ”业务 需求 


下 面 以 营销 系统 为 例 ， 介 绍 如 何 进行 业务 需求 分 析 。 

1) 将 营销 系统 整体 上 划分 成 几 个 部 分 : 例如 ， 可 以 划分 成 报表 系统 、 辅 助 决策 系统 。 

2) 分 列 对 营销 系 统 的 报表 系统 、 辅 助 决策 系统 进行 说 明 。 例 如 ， 报 表 系统 可 以 分 成 官 理 
类 、 营 销 监 挖 类、 客服 类 、 客 户 关 系 类 、 缴 费 类 等 儿 个 部 分 。 同 时 需要 说 明报 表 系 统 的 数据 
存储 方式 ， 数 据 展 示 的 层次 关系 ， 报 表 的 管理 流程 ， 报 表 的 功能 需求 等 内 容 。 而 辅助 决策 系 
统 需要 说 明 的 是 投 照 业务 主题 划分 ， 可 以 将 需求 分 成 儿 个 部 分 。 例 如 ， 莒 销 辅 助 决策 系统 可 
以 分 成 以 下 几 个 业务 主题 : 营销 绩效 主题 、 客 户 服务 主题 等 。 其 中 吉 销 绩效 主题 可 以 得 询 公 
司 的 主要 经 营 绩效 情况 ， 奉 询 项 可 以 是 销售 量 、 销 售 均 价 、 市 场 占 有 率 等 ， 同 时 需要 对 每 个 
指标 项 进行 说 明 。 

3) 对 系统 运行 环境 的 说 明 。 系 统 运行 环境 包括 系统 的 架构 、 系 统 的 便 件 设备 及 其 软件 等 
PE. Pa. TXTIASBERACR IRSE 18-7 Dra. 























业务 应 用 系统 


ODS 统一 信息 视图 区 





图 18-7 ”和 营销 辅助 决策 系统 的 架构 
其 中 ODS 统一 信息 视图 区 是 营销 辅助 决策 系统 文 持 决策 分 析 , 并 且 保 证 数据 正确 性 的 存 
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储 绥 冲 区 。 访 缓冲 区 和 耐 癌 的 是 营销 系统 源 数 据 第 一 次 ETL WTE, HIR RESE JA G 
为 该 应 用 系统 提供 数据 支持 。 

数据 仓库 是 根据 主题 域 的 划分 ， 对 历史 数据 的 集中 整合 和 存储 ， 同 时 数据 仓库 也 会 按照 
菏 种 频率 进行 定期 的 数据 更 新 ， 为 数据 展示 提供 文 持 。 数 据 集 市 是 在 数据 仓库 的 基础 上 按照 
星 形 结构 或 者 雪人 花形 结构 进行 数据 建 模 ， 是 报表 展示 的 基础 ， 为 营销 辅 助 决策 系 统 提供 各 种 
角度 的 数据 分 析 。 

系统 的 便 件 设备 说 明 见 图 表 18-2。 

















表 18-2 系统 的 硬件 设备 说 明 











硬件 设备 名 称 

uuo LODS 数据 库 可 以 使 用 Oracle 10g， 同 时 为 了 实现 高 可 用 人 性， 并且 达到 负载 均衡 的 标准 ， 可 以 采用 两 
服务 器 台 机 器 集群 的 形式 

营销 系统 ETL 数据 仓库 和 ETL 工具 运行 在 不 同 的 服务 器 中 ， 同 时 为 了 保证 系统 的 正常 运行 ， 需 要 采用 两 侣 服 


服务 右 、 数 据 仓 库 服务 器 “| 务 右 互相 进行 热 备份 的 机 制 
报表 展示 服务 器 和 应 用 BI 展示 和 应 用 系统 运行 在 不 同 的 服务 器 中 ， 同 时 为 了 保证 系统 的 正常 运行 ， 需 要 采用 两 台 服 务 
系统 " Pe as HEELS UBL. UA ERER E RPRANBEIET eT. Ds mv] 8) 9 — 8 HRAS 
"m 器 上 运行 


软件 列表 见 表 18-3。 











表 18-3 软件 列表 


软件 名 称 说 明 
ODS 统一 信息 视图 区 使 用 Oracle 10g 作为 ODS 统一 信息 视图 区 的 数据 库 管 理 系统 
数据 仓库 、 数 据 集 市 使 用 Oracle 10g 作为 数据 仓库 、 数 据 集 市 的 数据 库 管 理 系统 
ETL 工具 使 用 Informatica PowerCenter 作为 ETL 的 工具 
BI 软件 使 用 Cognos 8 作为 BI 展现 工具 
Web 应 用 服务 器 采用 BEA WebLogic Server 作为 Web 应 用 服务 器 


18.2.2 ”功能 需求 


营销 系统 以 销售 管理 模 其 为 核心 ， 包 丘 营 销 管 理 便 块 、 客 户 服务 模块 、 市 场 管理 模块 、 
客户 天 系 模块 、 冶 销 辅助 决策 分 析 模 块 等 。 以 营销 辅助 决 倘 分 析 模 块 为 例 ， 访 模块 是 营销 系 
统 最 高 层次 的 应 用 ， 通 过 对 和 营销 数据 的 分 析 、 挖 据 ， 使 企业 管理 层 人 员 及 时 了 解 营销 业务 的 
发 展 情况 ， 包 括 各 种 指标 的 完成 情况 ， 为 企业 的 发 展 决 策 近 供 帮 助 。 

营 铀 辅助 决策 的 功能 需求 包括 营销 系统 的 绒 效 盒 询 ， 见 表 18-4。 该 系统 可 以 通过 各 种 图 
形 ( 人 饼 形 图 、 柱 形 图 、 仪 表盘 等 形式 ) 、 表 格 、 文 字 等 方式 实现 对 营销 业务 的 分 析 与 预测 ， 
促进 管理 层 人 员 对 其 经 营 状 况 的 了 解 ， 为 其 相关 经 营 政 集 的 制定 提供 帮助 。 



































表 18-4 功能 需求 概述 
1. 销售 额 
2. 利润 
3. 费用 
4. 市 场 占 有 率 


营销 系统 的 绩效 查询 
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5. 营业 户 数 

6. 累计 销售 量 

7. 销售 收入 

营销 系统 的 绩效 查询 销售 市 场 管理 8. 解决 客户 投诉 率 
9. 销售 合同 率 


营销 系统 的 绩效 但 询 销售 完成 情况 





用 柱 形 图 和 人 饼 形 图 的 形式 实现 对 绩效 指标 的 分 析 ， 如 图 18-8 和 图 18-9 所 示 。 
绩效 指标 的 分 析 


O 一 Im A U 





1 月 2 月 3 H 4 月 
图 销售 额 国 利润 加 费用 
图 18-8 ” 柱 形 图 
利润 销售 额 


30% 25% "1H 
El 2 H 
E3 月 
B4 H 





图 18-9 ”人 饼 形 图 


(1) 经 营 顷 效 的 分 析 

按照 时 间 月 份 分 析 经 营 绩效 明细 情况 ， 包 括 销 售 额 、 利 润 、 费 用 、 市 场 占 有 率 等 指标 。 
(2) 销售 完成 情况 的 分 析 

按照 时 间 月 份 分 析 销 售 完 成 明细 情况 ， 包 括 膏 业 户 数 、 蛇 计 销 售 量 等 指标 。 

G) 销售 市 场 党 理 的 分 析 

按照 时 间 月 份 分 析 销 售 市 场 管理 情况 明细 ,包括 销售 收入 、 解 决 客户 投诉 率 、 销 售 合同 率 。 
各 项 指标 说 明 见 表 18-5. 








表 18-S$ 指标 说 明 


2 m 指标 说 明 
m" 销售 额 -销售 量 x 平 均 销售 价格 
m 利润 -收入 _ 费 用 
费用 企业 在 日 常 活动 中 所 消耗 的 经 济 利益 支出 
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MR d 指标 说 明 
市 场 占有 率 指 一 个 企业 的 销售 量 在 市 场 同 类 产品 中 的 比重 
营业 户 数 统计 期 内 按 某 种 分 类 统计 的 户 数 
累计 销售 量 本 年 统计 期 内 销售 量 的 合计 
销售 收入 销售 收入 二 产品 销售 数量 x 产品 单价 
客户 投诉 率 客户 投诉 率 -客户 投诉 次 数 /企业 服务 客户 的 总 次 数 
销售 合同 率 销售 合同 率 -签订 合同 的 数量 /总 的 销售 合同 数量 


18.3 ”营销 系统 设计 


18.3.1 ”总体 架构 设计 


营销 辅助 决策 系统 染 构 设计 如 图 18-10 所 示 。 


业务 系统 商业 智能 数据 
分 析 应 用 





图 18-10 “营销 辅助 决策 系统 架构 设计 


(1) 应 用 架构 

应 用 架构 是 指 业 务 数据 和 业务 系统 之 间 的 关系。 本 书 重点 接 述 的 是 数据 仓库 的 应 用 ， 所 
以 业务 应 用 系统 的 设计 不 属于 本 书 范围 。 

(2) 数据 仓库 -数据 访问 架构 

数据 仓库 -数据 访问 架构 是 指数 据 仓库 在 运行 时 的 各 个 流程 和 状态 ， 主 要 包括 ODS、 数 
据 仓 库 、 数 据 集 市 、 商 业 智 能 数据 分 析 应 用 ， 如 图 18-11 所 示 。 

(3) 运 维 管理 

运 维 管理 主要 包括 数据 的 备份 与 恢复 、 系 统 的 监控 、 性 能 的 管理 等 内 容 。 
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18-11. 数据 仓库 -数据 访问 染 构 


18.3.2 SHARR RAN ETL 染 构 设计 
ETL 架构 设计 主要 包括 抽取 、 清 洗 、 转 换 、 加 载 4 个 部 分 ， 如 图 18-12 所 示 。 





图 18-12 ETL 架构 设计 图 


其 中 抽取 主要 负责 将 营销 辅助 决策 系统 的 业务 源 数 据 提 取 到 数据 仓库 中 ， 业 务 源 数 据 可 











以 是 关系 型 数据 库 ， 也 可 以 是 各 种 文件 ， 例 如 xml 文件 、Excel 文件 、 文 本 文件 等 。 因 为 不 同 
业务 源 数 据 的 数据 质量 可 能 各 不 相同 ， 押 以 每 个 数据 源 的 抽取 方式 也 有 所 不 同 ， 它 们 都 需要 
建立 各 目 独 立 的 抽取 程序 ， 然 后 通过 通用 的 接口 将 源 数据 抽取 到 清洗 步骤 中 去 。 

抽取 步 又 主要 包括 对 数据 适 配 需 的 文 持 ， 使 得 抽取 程序 可 以 与 多 种 业务 数据 源 相 连接 。 
一 般 来 说 ， 源 数据 适配器 包含 对 JDBC, ODBC, XML 等 方式 的 支持 ， 为 两 端的 数据 交换 提 














供 最 基本 的 条 件 。 
清洗 步骤 主要 是 针对 数据 仓库 要 求 的 数据 质量 标准 ， 对 管 销 数据 进行 清洗 的 过 程 。 对 各 


销 数 据 清洗 的 方法 可 以 有 两 类 。 

1) 专用 的 清洗 程序 ， 目 的 是 针对 不 同 的 业务 系统 有 不 同 的 清洗 程序 。 

2) 通用 的 清洗 程序 ， 如 果 每 个 业务 源 系统 的 清洗 规则 相同 ， 可 以 使 用 目 定义 的 通用 函数 
来 满足 各 个 业务 源 系 统 的 清洗 程序 。 清 洗 工 作 的 主要 任务 是 对 业务 源 数 据 的 解 机 、 数 据 标 准 
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化 和 数据 合并 的 过 程 。 

转换 步骤 主要 负责 在 业务 源 数据 加 载 到 数据 仓库 之 前 的 最 后 一 次 修改 。 许 多 聚合 的 操作 
和 对 指标 的 计算 都 在 这 一 步骤 中 完成 。 

加 载 步骤 是 将 管 销 业务 源 数据 加 载 到 目标 数据 结构 中 。 这 些 目标 数据 结构 可 以 是 事实 
表 ， 也 可 以 是 维度 表 ， 这 是 ETL 过 程 的 最 后 一 步 。 
18.3.3 ”营销 辅助 决策 系统 数据 访问 功能 设计 

数据 访问 功能 主要 包括 : 报表 展示 功能 、 即 席 人 查询 
功能 、 联 机 分 析 处 理 功能 、 预 测 分 析 功 能 ， 如 图 18-13 
Bra. 

报表 展示 功能 一 般 从 数据 仓库 或 者 数据 集 市 中 读 取 
数据 ， 用 以 实现 目 定义 或 者 预定 义 的 展示 功能 。 使 用 报 
表 展 示 功 能 的 用 户 一 般 都 是 企业 的 高 层 领导 人 员 、 数 据 
分 机 人 员 、 业 务 人 员 等 。 

即席 奏 询 功能 是 对 相关 业务 准 实 时 性 的 奉 询 。 一 般 图 18-13 ”数据 访问 功能 
此 功能 是 提供 给 高 级 数据 分 机 人员 使 用 的 。 

联机 分 析 处 理 COLAPO 功能 是 通过 对 和 营销 辅助 决 案 系 统 业 务 数据 的 多 维 分 机 和 各 种 图 表 
的 展示 ， 以 实现 业务 数据 的 分 析 功 能 。 

预测 分 析 功 能 是 通过 数据 挖 据 等 统计 分 析 技 术 ， 利 用 数据 源 中 有 价值 的 数据 建立 起 来 的 
信息 系统 ， 为 用 户 提供 了 预测 与 分 析 的 功能 ， 这 也 体现 了 商业 智能 的 价值 。 


18.3.4 ”营销 辅助 决策 系统 展示 方式 设计 


d) 雷达 图 

雷达 图 主要 用 于 表示 当前 经 营 绩效 明细 情况 。 该 图 显示 了 各 组 数据 值 偏离 数据 原点 的 距 
E, Un 18-14 所 示 。 

(2) 柱 形 图 

柱 形 图 主要 用 于 表示 当前 经 营 绩效 明细 情况 。 该 图 显示 了 不 同月 份 、 不 同 数据 项 之 间 的 
比较 ， 如 图 18-15 所 示 。 















































2011-6-1 "ET 
BÜ A. " 
66 AN lii 利润 
2011-10-1 em Ae 53520071 Aa bd SUR 
\ ph 加 市 场 占有 率 
Ww l| 一 费用 
2 32011-5841 
图 18-14 雷达 图 图 18-15 柱 形 图 
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(3) 折线 图 

折线 图 主要 用 于 表示 当前 经 营 绩 效 明细 情况 的 数据 变化 趋势 ， 如 图 18-16 所 示 。 

(4) 饼 形 图 

饼 形 网 主要 用 于 显示 当前 丝 营 绩效 明细 情况 的 数据 相对 于 总 数值 鸭 大 小 和 所 后 比 重 ， 如 
图 18-17 所 示 。 























70 

60 

50 

i 销售 额 

30 

20 lil 2011-6-1 

10 lil 2011-7-1 

0 id 2011-8-1 
lil 2011-9-1 
lil 2011-10-1 
图 18-16 ”折线 图 图 18-17 HÆK 


(5) 面积 图 

面积 图 主要 用 于 显示 当前 经 营 绩效 明细 情况 的 每 一 数值 所 占 大 小 ， 随 时 间或 者 其 他 类 别 
而 变化 的 曲线 ， 如 图 18-18 所 示 。 

(6) 条 形 图 

条 形 图 主要 用 于 显示 当前 经 党 绩 效 明细 情况 数据 间 的 比较 , 数据 平行 的 演示 , 如 图 18-19 
所 示 。 






































2011-10-1 
2011-9-1 
"ETT 2011-8-1 
us Ld I S 7 
费用 E is 2011-7-1 TEETE 
E 销售 额 MUR -— 
$ E Z 7 = TARE 2011-6-1 国 利润 
图 18-18 面积 图 图 18-19 条 形 图 
18.3.5 ”营销 辅助 决策 系统 主题 分 析 功 能 设计 
下 面 举 例如 下 : 
销售 分 析 是 指 在 指定 时 间 范 围 内 ， 分 析 市 场 占 有 率 、 费 用 、 利 润 、 销 售 额 等 指标 ， 其 主 
要 分 析 内 容 如 下 : 





(1) 不 同 地 区 销售 情况 分 析 与 预测 
按照 相同 时 间 范围 内 、 不 同 的 地 区 范围 去 分 析 市 场 占 有 率 、 费 用 、 利 润 、 销 售 额 的 统计 
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分 析 和 同期 对 比分 析 。 

(2) 不 同 产品 类 型 销售 情况 分 析 与 预测 

按照 相同 时 间 范 围 内 、 不 同 的 产品 类 型 去 分 析 市 场 占 有 率 、 费 用 、 利 泗 、 销 售 额 的 统计 
分 析 和 同期 对 比分 析 。 


18.3.6 ”数据 模型 设计 


1. 企业 模型 和 企业 数据 模型 的 定义 和 关系 

企业 模型 主要 描述 的 是 企业 结构 和 企业 业务 活动 ， 而 企业 数据 模型 是 对 企业 业务 活动 的 
抽象 ， 通 过 数据 建 醒 的 方法 描述 企业 业务 的 主要 活动 和 各 种 经 营 过 程 。 企 业 数 据 模 型 是 在 企 
业 模 型 的 基础 上 建立 起 来 的 ， 主 要 用 于 文 持 辅助 决策 系统 中 ODS 模型 、 数 据 仓 库 模 型 、 数 据 
集 市 模型 的 建设 ， 是 企业 信息 化 的 基础 。 

2. 企业 数据 模型 建设 的 意义 和 内 容 

企业 数据 模型 建设 的 意义 有 以 下 几 个 方面 ， 如 网 18-20 所 示 。 

1) 企业 数据 模型 的 建设 有 利于 定义 企业 业务 活动 和 经 营 过 程 中 巡 到 的 基本 概念 和 主要 内 
容 ， 征 企业 信息 化 建设 的 第 一 步 。 

2) 企业 数据 模型 的 建设 有 利于 将 业务 数据 转化 成 有 价值 的 信息 和 知识 。 

3) 企业 数据 模型 的 建设 是 构建 ODS 模型 、 数 据 仓库 模型 、 数 据 集 市 模型 的 基础 。 

4) 企业 数据 模型 的 建设 是 企业 省 理 者 、 业 务 人 员 和 设计 开发 人 员 沟 通 的 基础 ， 有 利于 提 
局 辅助 决策 系统 开发 的 效率 。 

企业 数据 模型 的 内 容 主 要 分 为 :， 概念 模 型 设计 、 远 辑 模 型 设计 、 物 理 模型 设计 。 

(1) 概念 模型 设计 

1) 企业 数据 概念 模型 设计 主要 包括 主题 域 的 设计 、 主 题 与 实体 的 设计 。 一般 悄 况 下 ， 主 
是 域 包含 一 个 或 者 多 个 主题 ， 每 个 主题 的 最 小 单位 就 是 实体 。 例 如 在 图 18-21 中 ， 销 售 分 析 
主题 域 包含 地 区 销售 情况 分 析 与 预测 主题 ， 该 主题 义 包含 销售 人 员 实 体 。 





























































销售 分 析 
主题 域 


地 区 销售 情 
况 分 析 与 预 
ME 


定义 企业 业务 活动 的 基本 概念 和 主要 内 容 





将 业务 数据 转化 成 有 价值 的 信息 和 知识 


E 是 构建 ODS 模型 、 数 据 仓库 模型 、 数 据 集 市 模型 的 基础 | 


征 企业 管理 者 、 业 务 人 员 和 设计 开发 人 员 沟 通 的 平台 








“一 


图 18-20 ”企业 数据 模型 建设 的 意义 图 18-21 企业 数据 概念 模型 设计 举例 


2) 概念 模型 建设 的 依据 : 包含 企业 模型 、 现 有 的 应 用 系统 和 其 他 领域 的 经 验 , 如 图 18-22 
所 示 。 

3) 概念 模型 建设 的 步骤 : 通过 分 析 业务 系统 的 主要 数据 ， 结 合 业务 之 间 的 关系 列 出 详细 
的 数据 主题 ， 在 此 基础 上 ， 根 据 数据 主题 之 间 的 逻辑 关系 ， 将 其 划分 到 各 自 所 属 的 数据 主题 
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域 中 ， 最 后 形成 企业 级 主题 域 概念 模型 。 概 念 模型 建设 的 步骤 如 图 18-23 Br. 





其 他 领域 








企业 模型 的 经 验 I 
AO 务 系统 
图 18-22 ”概念 模型 建设 的 依据 图 18-23 ”概念 模型 建设 的 步骤 





下 面 以 稼 销 系统 为 例 进 行 介 绍 。 根 据 吾 销 系统 业务 和 经 从 活动 的 特点 ， 列 出 下 面 的 部 分 
数据 主题 ， 见 表 18-6。 


表 18-6 营销 系统 的 数据 主题 





数据 主题 数据 主题 说 明 
产品 基本 信息 主要 描述 企业 提供 产品 的 基本 情况 信息 和 各 种 服务 信息 
产品 价格 对 产品 价格 的 描述 


3 
X 
Jg 
AH 


对 企业 员工 教育 背景 的 描述 








职位 信息 对 企业 员工 工作 职位 的 描述 
人 员 基 本 信息 主要 描述 人 员 的 基本 信息 ， 包 括 人 员 的 教育 背景 、 性 别 、 姓 名、 家 庭 收入 等 
社会 保险 信息 对 各 种 社会 保险 的 定义 
产品 质量 信息 对 各 种 产品 质量 的 描述 
业绩 信息 对 工作 业绩 的 描述 
社会 关系 信息 对 企业 员工 基本 社会 关系 的 描述 


根据 数据 主题 之 间 的 风 辑 关系， 可 以 划分 成 以 下 儿 个 数据 主题 域 ， 人 员 主 题 域 、 产 品 主 
题 域 和 市 场 主题 域 ， 见 表 18-7. 


表 18-7 营销 系统 的 数据 主题 域 


主题 域 jü È 











pem 主要 描述 企业 经 营 活动 中 产生 的 人 员 基 本 信息 ， 包 括 企 业 的 内 部 人 员 信 息 和 与 企业 相关 的 其 他 人 员 的 
De SÉ 

产品 主题 域 主要 描述 企业 提供 的 产品 信息 和 各 种 服务 信息 

市 场 主题 域 主要 描述 企业 与 外 部 组 织 进行 商品 交易 时 所 产生 的 市 场 信息 





下 面 以 人员 主题 域 为 例 进 行 介绍 。 人 员 主 题 域 包 含 教育 背景 信息 、 人 员 职 务 信息 、 人 员 
工作 业绩 信息 、 人 员 社 会 保险 信息 、 人 员 社 会 关系 信息 ， 如 图 18-24 IR. 

(2) 逻辑 模型 设计 

逻辑 数据 模型 是 对 概念 模型 的 分 解 和 细 化 ， 主 要 插 述 了 实体 、 属 性 、 实 体 和 实体 之 间 的 
天 系 等 内 容 。 实 体 通 党 是 企业 经 营 活 动 中 的 一 个 事件 、 一 个 概念 、 一 个 日 第 的 业务 活动 或 者 
征 一 个 参与 者 。 属 性 是 描述 实体 相关 特性 和 定义 的 信息 。 关 系 是 描述 实体 和 实体 乙 间 的 业务 
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4 8 AHORA ARBUSDAMPI,: MERE ARRE ss DUE 
包含 购买 商品 价格 信息 、 用 户 地 址 信息 、 用 户 应 收费 用 和 用 户 账 





规则 或 者 关联 关系 。 下 面 以 部 
图 18-25 中 ， 用 户 基本 信息 包 
单 信息 。 








A RES 
保险 信息 










DS P 
图 18-24 人 员 主 题 域 


购买 商品 价格 信息 用 户 地址 信息 
E 


Lc 
C 
A 


^ j^ 
Relationship 6 Relationship 5 


用 户 基本 信息 — 
| MEM 





Cy e 


Relationship 4 relation. 
p 


用 户 应 收费 用 D 
| MM 





图 18-25 逻辑 模型 设计 


(3) 物理 模型 设计 

物理 数据 模型 主要 描述 了 模型 实体 数据 存储 方面 的 内 容 。 在 设计 的 时 候 ， 需 要 考虑 数据 
的 类 型 、 长 度 和 索引 结构 。 除 此 之 外 ， 还 需要 考虑 数据 存储 的 性 能 问题 和 数据 库 产 品 的 特点 。 
下 面 以 部 分 营销 系统 物理 模型 为 例 ， 描 述 物理 模型 的 特点 。 例 如 在 图 18-26 中 ， 和 营销 系统 包 
含 用 户 信息 表 、 职 务 类 型 编码 表 、 商 品类 型 编码 表 、 用 户 地 址 编码 表 。 

3. 企业 数据 模型 与 其 他 模型 的 关系 

企业 数据 模型 是 从 企业 的 整体 角度 来 描述 企业 的 信息 化 建设 , 是 构建 ODS 数据 模型 、 数 
据 仓库 数据 模型 、 数 据 集 市 数据 模型 的 基础 。 

企业 数据 模型 与 其 他 模型 的 关系 如 图 18-27 所 示 。 

4. ODS 数据 模型 建设 

ODS 统一 信息 视图 区 的 概念 模型 是 依据 企业 数据 模型 构建 的 ， 它 是 按照 主题 进行 规划 组 
织 的 ， 一 般 来 说 ， 都 是 最 近 时 间 的 或 者 实时 的 数据 存储 ， 使 用 户 能 够 快速 查询 数据 。ODS x 
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一 信息 视图 区 需要 满足 两 个 条 件 : IRL A DRIZH ZEUG AGR EER, X AE SIC 
时 性 获取 数据 的 要 求 。 


职务 类 型 编码 表 品类 型 编码 表 
职务 编码 varchar(20) 《pky> 商品 类 型 编码 yarchar (20) 《pk> 
职务 和 名称 varchar (20) 品类 型 各 称 varchar (20) 








FK_ 用 户 信息 表 _REFERENCE_ 用户 信 息 表 _REFERENCE_ 商 品类 型 编码 表 





FK FPE EE REFERENCE. 用 户 地址 编码 表 


用 户 地 址 编码 表 


用 户 地 址 编码 varchar(20) 
用 户 地 址 和 名称 varchar (400) 





图 18-26 物理 模型 设计 





企业 数据 模型 


ODS 数据 模型 、 数 据 仓库 数据 模型 、 数 据 集 市 数据 模型 








图 18-27 企业 数据 模型 与 其 他 模型 的 关系 


ODS 逻辑 模型 设计 是 针对 好 辑 层 进行 设计 ， 主 要 包括 逻辑 结构 








的 设计 、 存 储 周 期 的 设计 和 存储 粒度 的 设计 。 对 


D ODS 逻辑 结构 设计 主要 和 包括: 实体 和 实体 属性 的 定义 、 实 体 
和 实体 之 间 关系 的 定义 。 

2) 存储 周期 的 设计 主要 是 针对 数据 存储 期 限 的 定义 。 一 般 来 说 ， eem 
在 ODS FEKE Hietrssesr t), 3E BLAST ES TH 25098 o 属性 和 实体 之 间 
3) 存储 粒度 的 设计 主要 是 对 数据 细节 程度 大 小 的 定义 ， 粒 度 的 
大 小 直接 决定 了 数据 量 的 大 小 和 查询 的 灵活 性 ， 是 逻辑 设计 中 重点 

要 解决 的 一 个 问题 。 

















EE - 形成 最 终 的 ODS 
ODS JE BEBE EVER] cz jx ul KE] 18-28 所 不 。 逻辑 结构 说 明 书 


1) 根据 业务 系统 的 调研 结 未 ， 划 分 ODS WER. WIAR mi 
要 参考 业务 系统 的 原 模型 ， 根 据 需 求 调研 的 结果 划 定 主要 的 数据 主 1828 ODS ERAS 








题 范 围 ， 在 数据 主题 的 基础 上 进行 各 个 主题 的 定义 。 设计 的 一 般 步 又 
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2) 在 主题 定义 完成 之 后 ， 开 始 进行 实体 、 实 体 属 性 、 实 体 和 实体 之 间 关 系 、 数 据 的 存储 
粒度 和 存储 周期 的 定义 。 在 此 基础 上 ， 需 要 保证 所 有 实体 的 唯一 性 。 

3) 形成 ODS 逻辑 结构 说 明 书 。 根 据 以 上 的 步骤 ， 在 ODS 逻辑 结构 说 明 书 中 对 业务 需 
求 、 数 据 主 题 的 范围 、 主 题 的 定义 、 实 体 、 实 体 的 属性 、 实 体 和 实体 之 间 的 关系 进行 详细 的 
说 明和 解释 。 

ODS 逻辑 模型 设计 的 原则 如 下 : 

1) 以 营销 系统 为 例 ， 几 是 涉及 营销 系统 使 用 其 他 系统 的 数据 ， 都 应 该 将 该 系统 的 实体 放 
入 ODS 逻辑 模型 中 。 例 如 ， 营 销 系 统 使 用 人 力 资源 系统 和 商品 交易 系统 作为 稳定 的 数据 源 ， 
则 将 人 力 资 源 和 商品 交易 系统 的 实体 放 入 到 营销 辅助 决策 系统 的 ODS 逻辑 模型 中 。 反 之 ， 如 
果 人 力 资源 系统 和 商品 交易 系统 都 使 用 营销 系统 作为 稳定 的 数据 源 ， 则 不 需要 将 人 力 资源 和 
商品 交易 系统 的 实体 放 入 营销 辅助 决策 系统 的 ODS 逻辑 模型 中 。 

2) 外 部 业务 系统 的 基础 数据 一 般 不 放 入 ODS 逻辑 模型 中 。 例 如 ， 其 他 商品 的 生产 信息 
作为 生产 系统 的 基础 数据 ， 但 是 不 放 入 营销 系统 














人 
的 ODS 逻辑 模型 中 o 型 编码 varchar2(200) 《pk> 
pr S e a ka So HELP j varchar 
3) 营销 辅助 决策 系统 涉及 的 各 个 主题 域 中 men 





FERRIS, AEA ODS BHARA R 

例如 ， 营 销 辅助 决策 系统 中 的 商品 类 型 编码 实体 

HA ODS XE HEBUM P, WII 18-29 所 不 。 图 18-29 JU. ODS 逻辑 模型 中 的 编码 实体 
ODS 逻辑 模型 设计 的 原则 如 图 18-30 Br» 


”营销 系统 使 用 
| 其 他 系统 的 数 










据 ， 都 将 该 系 
统 的 实体 放 入 
到 ODS 逻辑 
模型 中 


会 












ODS 逻辑 
| 模型 设计 
\ 的 原则 
m O pe 
系统 Hh ys 
| 体 ， 一 般 都 放 REMIS S. 
MEL 般 不 放 入 ODS 
nd 逻辑 模型 中 


图 18-30 ODS 逻辑 模型 设计 的 原则 


ODS 物理 模型 设计 主要 是 针对 ODS 数据 模型 的 物理 实现 进行 设计 ， 主 要 包括 数据 的 存 
储 结构 、 索 3 引 方式 等 内 容 。 
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ODS 物理 模型 设计 的 步骤 如 下 : 

1) 确定 数据 的 存储 结构 。 

2) 确定 数据 的 抽取 频率 ， 数 据 量 的 大 小 和 啊 应 时 间 ， 这 些 信息 是 优化 的 重要 依据 。 

3) 确定 数据 优化 的 方式 :例如 索引 策略 、 分 区 。 

5. 数据 仓库 数据 模型 建设 

数据 仓库 概念 模型 的 主要 功能 束 是 确定 用 户 决 俩 分 析 涉 及 的 所 有 问题 和 信息 。 例 如 ， 在 
进行 销售 情况 分 析 时 ， 可 以 根据 销售 的 时 间 、 地 区 范围 、 产 品类 型 等 分 析 各 个 指标 。 数 据 仓 
库 模 型 可 以 分 成 企业 的 核心 历史 数据 区 域 和 轻 度 汇总 数据 区 域 两 个 部 分 。 其 中 ， 企 业 的 核心 
历史 数据 区 域 主要 包括 主题 域 、 主 题 、 实 体 ， 以 及 实体 与 实体 乙 间 的 关系 ， 同 时 为 了 实现 历 
史 数 据 的 保存 ， 每 个 实体 需要 有 一 个 时 间 玲 。 轻 度 汇 总 数据 区 堪 是 根据 决 案 分 析 的 需求 ， 制 
定 相应 的 汇总 稼 略 ， 以 满足 用 户 的 需要 。 

数据 仓库 馆 辑 模型 主要 是 针对 和 馆 辑 层 进行 设计 ， 主 要 包括 主题 域 变 计 、 主 题 设 计 等 内 容 。 

数据 仓库 逻辑 模型 设计 的 主要 工作 有 : 

1) 确定 主题 域 和 每 个 主题 域 有 哪些 主题 。 

2) 确定 粒度 的 层次 划分 。 

3) 确定 数据 的 存储 周期 。 

部 分 营销 系统 数据 仓库 效 辑 模型 实例 如 图 18-31 所 示 。 


职务 类 别 编码 表 商品 类 别 编 码 表 


职务 类 别 编码 《pi> varchar2(20) «XN» 商品 类 别 编码 《pi> varchar2(20) 《下 > 
职务 类 别名 称 varchar2(400) 商品 类 别名 称 varchar2 (400) 


Identifier 1<piy> Identifier 1<pi> 






































Relationship 8 Relationship 9 





T PS 
用 户 基本 信息 表 
用 户 编 号 <pi> varchar2(20) XN» 
Hi P eR varchar2(400) 
职务 类 别 编 码 varchar2(20) 
商品 类 别 编 码 varchar2(20) 
联系 方式 varchar2(20) 
购买 商品 数量 Humber 








Relationship 10 


用 户 购买 商品 汇总 信息 表 


年 月 《pi> varchar2(20) XN» 
购买 商品 数量 Hunber 
Identifier 1«4pi» 








图 18-31 数据 仓库 逻辑 模型 实例 


数据 仓库 物理 模型 设计 主要 是 针对 数据 仓库 的 物理 层 进 行 设计 ， 主 要 包括 数据 的 存储 结 
构 、 索 引 方式 等 内 容 。 数 据 仓 库 物 理 模型 设计 的 步 又 与 ODS 物理 模型 的 设计 步 又 是 完全 相同 
的 ， 在 此 不 再 资 述 。 但 是 需要 强调 的 是 ， 因 为 数据 仓库 的 数据 量 一 般 是 巨大 的 ， 并 且 数 据 仓 
库 中 的 数据 一 般 是 不 更 痢 的 ， 所 以 可 以 采用 复杂 的 索引 策略 ， 以 获得 最 优 的 数据 存储 和 伍 询 
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RUPEM 


商品 类 别 编 码 varchar?2(20) «pk»? 职务 编码 varchar2(20) <pk> 


商品 类 别名 称 varchar2(20) 职务 和 名称 varchar2(200) 





FK_ 用 户 基本 信 f. REFERENCE K Jd 户 基本 信 息 _REFERENCE_ 职 务 类 别 


M / 
b" / 
V / 


用 户 基 本 信息 


号 varchar2(20) <pk> 
mAy b varchar2(20) Xfk1» 
编码 varchar2(20) <fk2> 
和 名称 varchar2(20) 
方式 varchar2(20) 

商 ci 


品 数 量 number 


务 
P 
系 
2 





图 18-32 ”数据 仓库 物理 模型 实例 


6. 数据 集 市 数据 模型 建设 





数据 集 市 概念 模型 是 根据 业务 需求 建立 起 来 的 ， 它 可 以 包含 两 部 分 内 容 : 








效率 ， 并 且 降 低 了 维护 索引 的 难度 。 部 分 营销 系统 数据 仓库 物理 模型 实例 如 图 18-32 所 示 。 


综合 类 的 分 析 


得 询 和 专业 性 的 分 析 碍 询 。 其 中 综合 类 的 分 析 碍 询 是 根据 企业 的 整体 环境 ， 包 括 企业 的 总 体 


HON 77 £T RIS 








想 ， 对 企业 的 主要 指标 进行 综合 分 析 和 预测 。 专 业 性 的 分 析 查 询 是 根据 不 


同 的 部 门 和 组 织 机 构 对 他 们 各 目 所 关心 的 指标 进行 分 析 和 俘 询 。 通 第 数据 集 市 的 数据 来 源 是 








数据 仓库 中 的 历史 数据 或 者 轻 度 汇总 数据 。 
通过 对 企业 的 十 求 调研 ， 分 析 已 有 的 业务 报表 系统 和 企业 的 战略 分 析 目 标 ， 设 计 出 相应 
的 数据 集 市 模型 ， 见 表 18-8。 





表 18-8 对 企业 的 需求 调研 


A Bio 销售 情况 分 析 
维度 时 间 、 地 区 范围 、 产 品类 型 
时 间 ， 年 -月 -日 
维度 层次 地 区 范围 ， 省 -地 市 
产品 类 型 ， 食 品 、 服 装 、 玩 具 、 家 电 
分 析 指标 市 场 占有 率 、 费 用 、 利 润 、 销 售 售 
数据 来 源 营销 系统 
关注 对 象 公司 高 层 管理 人 员 所 有 业务 人 员 
备注 信息 


数据 集 市 模型 如 图 18-33 所 示 。 





数据 集 市 逻辑 模型 主要 是 针对 远 辑 层 进 行 设 计 ， 主 要 包括 维 表 的 设计 、 事 实 表 的 设计 等 
谷 。 


数据 集 市 的 主要 工作 有 : 

D 分 析 当 前 的 主题 域 ,确定 主题 域 下 和 耐 有 哪些 主题 。 
2) 确定 粒度 的 层次 。 

3) 确定 事实 表 中 有 哪些 指标 。 
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销售 情况 事实 表 
市 场 占有 率 
费用 

利润 

gi EC 





图 18-33 ”数据 集 市 模型 





4) 确定 事实 表 中 关联 哪些 维度 。 
5) 确定 数据 集 市 的 关系 模式 ， 例 如 是 雪人 花形 模式 还 是 星 形 模式 。 
维 表 设 计 见 表 18-9 一 表 18-12. 





表 18-9 时 间 维 表 


A W 数据 类 型 是 否 主 键 
TIME CODE varchar (8) 
TIME NAME varchar (64) 


& m EL 
CF TYPE CODE varchar (8) 
CP TYPE NAME varchar (64) 


318-11 地 区 维 表 


A of 数据 类 型 Æ T E 
DQ TYPE CODE Varchar (b) 
DQ TYPE NAME Varchar (64) 


表 18-12 销售 情况 事实 表 


wa O | vero —  N — 





Z|~ 
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$ K 
时 间 编 码 
Hs] TR] ERU 


ipo 
地 区 编码 
地 区 名 称 


io m 
编写 
时 间 编 码 
产品 类 型 编码 
地 区 编码 
TARAK 


CÈ) 
ET 数据 类 型 是 否 主键 TES 


数据 集 市 物理 模型 设计 主要 是 针对 数据 集 市 的 物理 层 进行 设计 ， 主 要 包括 数据 的 存储 结 
构 、 索 引 方式 等 内 容 。 数 据 集 市 的 物理 模型 设计 步骤 与 数据 仓库 物理 模型 的 设计 步 又 是 完全 
相同 的 ， 在 此 不 再 资 述 。 但 是 需要 强调 的 是 ， 数 据 集 市 的 数据 量 相 对 较 大 ， 并 且 数 据 集 市 中 
的 数据 一 般 是 不 更 新 的 ， 所 以 可 以 采用 复杂 的 索引 策略 ， 以 获得 最 优 的 数据 存储 和 奉 询 效率 ， 
并 且 降 低 了 维护 索引 的 难度 。 

数据 集 市 物理 模型 实例 如 图 18-34 所 示 。 


























Iri [al ix Ab pé SE 
HEEL Rie nde MEME rarcnarzí2 < 


时 间 和 名 称 varchar2(200) 


FK_ 销 售 情况 事实 表 _REFERENCE_ 时 间 维 $ 情 况 事 实 表 _REFERENCE_ 地 区 维 表 











销 此 情况 事实 表 


号 varchar2 (200) 

代码 varchar2(200) 《fk2> 
编码 varchar2(200) <fk1> 
类 别 编 码 varchar2(200) <fk3> 
占有 率 





场 number 
Ri number 

iJ i8 number 
G 


E: 7] number 





一 -一 





PK_ 销 售 情况 事实 表 _REFERENCE 产品 类 型 维 表 


产品 类 别 编 码 varchar2(200) «pk»? 


产品 类 别名 称 varchar2(200) 





图 18-34 ”数据 集 市 物理 模型 实例 


18.4 ETI 数据 抽取 


18.4.1 ETL 物理 设计 
PowerCenter Folder 的 划分 见 表 18-13 和 图 18-35. 


表 18-13 PowerCenter Folder 的 划分 


1 从 源 数据 库 抽取 到 ODS 数据 缓冲 区 

2 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 
3 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 

4 从 数据 仓库 抽取 到 数据 集 市 
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由 :| MARKET | BLIFFER. 
ELT] MARKET | DM 
H-E MARKET | DW 
H-E MARKET , VIEW 


图 18-35 PowerCenter Folder 的 划分 


18.4.2 ”从 源 数 据 库 抽取 到 ODS 数据 缓冲 区 
F 面 以 用 户 基本 信息 表 OLK 18-14) 为 例 进行 介绍 。 








更 新 策略 : 采用 全 量 抽取 的 方式 ， 只 保留 最 新 的 数据 。 
18.4.3 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 
从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 见 表 18-15. 








KR 18-15 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 


monom | wasa | mox | vc | ——— 

C1) 抽取 策略 

每 月 定时 抽取 。 

(2) 更 新 策略 

第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 

(3) 抽取 的 方法 

D 全 量 抽 取 : Select * from ODS 数据 缓冲 区 的 表 。 

2) 增 量 抽 取 : where TO DATE (M Time, YYYYMM') >=TRUNC (ADD MONTHS 
(SYSDATE, -1), 'MM’). 
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184.4 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 
从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 见 表 18-16。 





表 18-16 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 


(1) 抽取 策略 

每 月 定时 抽取 。 

(2) 更 新 策略 

第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 

(3) 抽取 的 方法 

1) 全 量 抽 取 : Select * from ODS 统一 信息 视图 区 的 表 。 

2) 增 量 抽取 : where TO DATE(M Time'YYYYMM')>=TRUNC(ADD MONTHS(SYSDATE, 
-1),MM'")。 


18.4.5 ”从 数据 仓库 抽取 人 到 数据 集 市 
从 数据 仓库 抽取 到 数据 集 市 见 表 18-17. 











表 18-17 从 数据 仓库 抽取 到 数据 集 市 


(1) 抽取 策略 
每 月 定时 抽取 。 
(2) 更 狐 策 略 
第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 


4i 
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(3) 抽取 的 方法 
1) 全 量 抽 取 : Select * from 数据 仓库 的 表 。 
2) 增 量 抽取 : where TO DATE(M Time'YYYYMM'")>=TRUNC(ADD MONTHS (SYSDATE, 


=I) 'IMM )。 


18.0 ”报表 展示 


1. 报表 一 饼 形 图 





商品 类 型 -商品 数量 饼 形 图 如 图 18-36 所 示 。 
商品 数量 


m 家 电 类 
图 食品 类 

服装 类 
m 家 居 类 





图 18-36 ”商品 类 型 -商品 数量 饼 形 图 


2. 报表 一 柱 形 图 
商品 类 型 -商品 数量 柱 形 图 如 图 18-37 所 示 。 
3. 报表 一 折线 图 
商品 类 型 -商品 数量 折线 图 如 图 18-38 所 示 。 
1600 
1400 


1200 
1000 








商品 类 型 -商品 数量 折线 图 


m 家 电 类 一 家 电 类 号 食品 类 二 服装 类 一 家 居 类 


B 食品 类 
一 m 服装 类 
m 家 居 类 


图 18-37 商品 类 型 -商品 数量 柱 形 图 











1 月 2H 3 H 4 H 





18.0 ”编写 测试 报告 


测试 报告 主要 包括 以 下 儿 个 部 分 。 
1. 编写 测试 概要 
根据 测试 计划 对 全 部 功能 进行 测试 ， 包 括 测 试 的 结果 ， 是 耕 如 期 完成 。 
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2. 测试 的 环境 

(1) 便 件 环境 

便 件 环境 主要 描述 应 用 服务 器 的 配置 ， 数 据 库 服务 器 的 配置 ， 如 图 18-39 所 示 。 

(2) 系统 软件 环境 

系统 软件 环境 主要 描述 应 用 服务 占 和 数据 库 服 务 占 所 在 的 系统 环境 ， 如 图 18-40 所 示 。 


€ CPU: 8 e CPU: 8 “应 用 服务 器 : 


Windows 2003SP3 、 
Weblogic 9.2 

= 数据 库 服务 器 : - 
Windows 2003 SP3 、 
Oracle 10g 


* RAM: 16G * RAM: 16G 
。 硬盘 : 500G . fidi. 500G 





图 18-39 ”硬件 环境 图 18-40 系统 软件 环境 
3. 测试 结果 分 析 
测试 结果 分 析 主 要 包括 用 例 编号、 测试 项 、 测 试 子 项 、 功 能 点 、 输 入 数据 、 了 预计 输出 的 
信息 、 测 斌 结果 和 对 问题 的 描述 ， 见 表 18-18 和 图 18-41. 
表 18-18 测试 结果 分 析 举 例 


用 例 编号 测试 子 项 输入 数据 | 预计 输出 的 信息 | 测试 结果 | 问题 描述 








E 查看 页 面 显示 是 "eT" 

01 首页 “| 首页 月 报 | WHER e 显示 全 部 的 信息 
argal L 

B p | RARE | 显示 全 部 的 信 

首页 月 报 条 什 及 其 组 合 进 | 息 , 信息 显示 正确 





但 看 仪表 盘 显 示 显示 全 部 的 信 
AETHER Js 信息 显示 正确 
但 看 柱 形 图 显示 显示 全 部 的 信 


ESE% Te 信息 显示 正确 


03 首页 








04 











测试 子 项 


C m J 


预计 输出 的 信息 


| | 
ÇC o J 
CEON 7 


测试 结 采 


E 对 问题 的 摘 述 EN 
图 18-41 测试 结果 分 析 
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4. 对 问题 的 统计 
对 问题 的 统计 包括 问题 的 分 类 严重、 一 般 、 建 议 )、 问 题 状 态 、 分 类 的 统计 、 小 计 、 总 
计 等 内 容 ， 见 表 18-19. 


表 18-19 对 问题 的 统计 


问题 的 分 类 问题 状态 Bo 
LX 1 x 
严重 
| | bk | 8 O| 
| — *ÉR | 2 O 
一 般 
OoOo oek | 6 | 
OoOO *ÉR | 2 O 
建议 4 
| 85k — |] ? | O 
5. 测试 内 容 
测试 内 容 包 括 功 能 模块 的 分 类 (首页 、 指 标 监控 、 高 级 查询 )、 问 题 状态 、 分 类 的 统计 、 
小 计 、 总 计 等 内 容 ， 见 表 18-20. 


21 








X 18-20 测试 内 容 


— | n Bo 
— uw [3 — 
首页 
LL 
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。 测试 结论 
试 结论 主要 描述 本 次 测试 是 否 完 全 按照 测试 计划 和 测试 用 例 进 行 ， 主 要 测 出 了 哪些 问 
人 是 个 已 经 达到 
了 测试 的 目的 等 内 容 。 


18.1 编写 用 尸 手 册 


用 户 手 册 主 要 包括 以 下 儿 个 部 分 。 

(1) 对 系统 的 概述 

Hu: 主要 包括 哪些 部 分 ， 有 哪些 分 析 功 能 。 

指标 监控 : 包括 哪些 指标 监控 专题 分 机 ， 例 如 工作 目标 执行 情况 分 析 。 

业务 专题 分 析 : 包括 哪些 业务 领域 的 专题 分 析 ， 例 如 人 力 资 源 分 析 。 

rae: 主要 包括 企业 禹 层 领导 关注 的 查询 内 容 有 哪些 ， 例 如 企业 单位 职工 情况 
































高 级 分 析 : 主要 包括 系统 多 维 分 析 主 题 的 内 容 ， - l 
例如 人 员 信 息 主 题 分 析 等 。 分 析 
V 


TR Eri: ERORAR ERTA WRK. 


对 系统 的 概述 如 图 18-42 所 示 。 e c [ 52s 
(2) 用户 使 用 说 明 
用 户 使 用 说 明 描述 用 户 如 何 登录 到 系统 当中 ， 输 图 18-42. ”对 系统 的 概述 


入 的 网 址 是 什么 ;进入 到 系统 之 后 ， 如 何 进 行 具 体 的 操作 ， 例 如 对 首页 、 指 标 监 控 、 业 务 专 
题 分 析 、 局 层 领导 合 询 、 忆 级 分 析 、 报 表 合 询 等 内 容 进 行 操作 。 


18.8 ”软件 发 布 
软件 发 布 的 内 容 主要 包括 :填写 系统 软件 的 名 称 ， 版 本 的 具体 信息 ， 对 发 布 的 说 明 CR 


统 实现 了 哪些 主要 功能 )， 发 布 的 内 容 〈 主 要 是 源 代 公 或 者 升级 包 )。 
软件 发 布 还 包括 一 些 配 置 项 和 非 配 置 项 的 管理 ， 见 表 18-21 和 表 18-22。 











表 18-21 配置 管理 


表 18-22 非 配置 项 管理 


o [mem | 


18.9 系统 运行 维护 


(1) 数据 库 官 理 系 统 

数据 库 系 统 维护 内 容 主 要 包括 对 数据 库 参 数 的 维护 、 数 据 库 表 空 间 的 维护 、 数 据 库 文件 
的 维护 、 数 据 库 用 户 的 维护 等 内 容 。 

(20 系统 故障 处 理 

当 数 据 库 文 件 损坏 时 ， 应 该 首先 删除 数据 库 的 用 户 和 表 空 间 ， 然 后 建立 新 的 用 户 和 对 应 
的 表 空 间 ， 最 后 根据 数据 库 的 日 志文 件 将 数据 库 文件 恢复 。 

当 数 据 库 服务 器 中 的 便 件 出 现 故障 时 ， 应 该 在 列 的 服务 占 中 建立 新 的 数据 库 ， 分 别 建 六 
数据 库 用 户 及 表 空 间 ， 将 数据 库 备 份 文件 恢复 到 新 的 服务 器 中 ， 以 你 证 系统 正常 运行 。 
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18.10 — zzz 


1) 项 目 工作 计划 的 制订 包括 : 对 项 目 育 景 与 目的 的 描述 、 确 定 项 目 需要 交付 的 成 采 、 制 
定 项 目 管理 文档 、 项 目 进度 划分 。 

2) 需求 分 析 包 拓 : 业务 再 求 概 述 、 功 能 需求 概述 。 

3) 数据 访问 功能 主要 包括 : 报表 展示 功能 、 即 席 碍 询 功能 、 联 机 分 析 处 理 功 能 、 预 测 分 
析 功 能 。 

4) 报表 展示 功能 一 般 从 数据 仓库 或 者 数据 集 市 中 读 取 数据 ， 用 以 实现 目 定 义 或 者 预定 义 
的 展示 功能 。 使 用 报表 展示 功能 的 用 户 一 般 都 是 企业 的 高 层 领导 人 员 、 数 据 分 机 人 员 、 业 务 
人 员 等 。 

5) 即席 碍 询 功能 是 对 业务 准 实时 性 的 查询 。 一 般 此 功能 是 提供 给 高 级 数据 分 析 人 员 所 使 
用 的 。 

6) 联机 分 析 处 理 〈OLAP) 功能 是 通过 对 营销 辅助 决策 系统 业务 数据 进行 多 维 分 机 和 各 
种 图 表 展 示 ， 以 实现 业务 人 员 对 数据 的 分 析 功 能 。 

7) 预测 分 析 功 能 是 通过 数据 挖 据 等 统计 分 析 技 术 ， 利 用 数据 源 中 有 价值 的 数据 建立 起 来 
的 信息 系统 ， 为 用 户 提 供 了 预测 与 分 析 的 功能 ， 这 也 体现 了 商业 智能 的 价值 。 

8) 企业 模型 主要 描述 的 是 企业 结构 和 企业 业务 活动 ， 而 企业 数据 模型 是 对 企业 业务 活动 
的 抽象 ， 通 过 数据 建 醒 的 方法 描述 企业 业务 的 主要 活动 和 各 种 经 营 过 程 。 企 业 数 据 模型 是 在 
企业 模型 的 基础 上 建立 起 来 的 ， 主 要 用 于 文 持 辅助 决策 系统 中 ODS 模型 、 数 据 仓 库 模 型 、 数 
据 集 市 模型 的 建设 ， 是 企业 信息 化 的 基础 。 

9) 企业 数据 模型 的 内 容 主要 分 为 : 概念 模型 设计 、 效 辑 模 型 设计 、 物 理 模 型 设计 。 

10) 数据 仓库 模型 可 以 分 成 企业 的 核心 历史 数据 区 域 和 轻 度 汇总 数据 区 域 两 个 部 分 。 企 
业 的 核心 历史 数据 区 域 主 要 包括 主题 域 、 主 题 、 实 体 ， 以 及 实体 与 实体 之 间 的 关系 ， 同 时 为 
了 实现 历史 数据 的 保存 ， 每 个 实体 需要 有 一 个 时 间 戳 。 轻 度 汇总 数据 区 域 是 根据 决策 分 析 的 
珊 求 ， 制 定 相应 的 汇总 荣 略 ， 以 满足 用 户 的 需要 。 

11) 数据 集 市 概念 模型 是 根据 业务 需求 建立 起 来 的 ， 它 可 以 包含 两 部 分 内 容 : 综合 类 的 
分 析 碍 询 和 专业 性 的 分 析 碍 询 。 

12) 数据 集 市 的 主要 工作 有 : 
分 析 当 前 的 主题 域 ， 确 定 主题 域 下 面 有 哪些 主题 。 
确定 粒度 的 层次 。 
确定 事实 表 中 有 哪些 指标 。 
确定 事实 表 中 关联 哪些 维度 。 
确定 数据 集 市 的 天 系 模式 ， 例 如 是 雪 伦 形 模式 还 是 星 形 模 式 。 
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9 19 4t 大 数据 淋 构 与 实践 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 大 数据 的 处 理 扩 术 。 

e 大 数据 下 的 数据 架构 。 

e 大 数据 的 处 理 流程 。 

e 大 数据 在 银行 业 的 应 用 与 实践 。 


191 大 数据 概述 


目前 ,“ 大 数据 ”在 金融 行业 、 互 联 行业 已 应 用 非 党 广泛， 这些 行业 在 运 彰 过程 中 产生 了 
海量 的 数据 ， 企 业 通 过 挖掘 数据 的 价值 ， 为 客户 提供 各 种 服务 。 大 数据 的 主要 应 用 包括 : MV 
务 的 实时 和 营销、 客户 精准 营销 、 用 户 实 时 分 析 、 金 融 其 诈 检 测 、 实 时 广告 定位 、 精 准 广 告 投 
放 和 实时 促销 等 内 容 。 

一 般 来 说 ， 我 们 每 天 都 在 产生 大 量 的 数据 ， 根 据 Gartner FIXE X, A HRS S 
4V 的 特性 : 数据 量 (Volume )、 数 据 种 类 的 多 样 性 (Variety)、 实 时 性 CVelocity) 和 商业 
价值 (Value)。 

数据 量 大 (Volume): 例如 互联 网 、 物 联网 每 天 都 在 产生 大 量 的 数据 ， 它 以 前 所 未 有 的 速 
度 增 加 ， 数 据 量 大 是 大 数据 的 主要 特征 之 一 。 例 如 电子 商务 网 站 每 天 都 可 以 访问 1 亿 次 ， 每 
年 大 概 有 10 亿 人 次 访问 。 

实时 性 强 CVelocityo: 数据 产生 的 速度 快 ， 变 化 的 频 度 可 以 到 唉 秒 级 。 例 如 我 们 每 天 可 
以 通过 传感器 、 发 布 微 博 或 者 监控 视频 产生 新 的 数据 ， 它 正 以 比 以 前 更 快 的 速度 产生 。 

数据 多 样 化 〈Variety): 指数 据 类 型 的 复杂 性 和 多 样 性 。 一 般 来 说 ， 大 数据 的 80% 都 是 非 
结构 化 的 数据 。 例 如 : 首 频 、 视 频 、 文 本 、 微 博 、 点 击 流 和 日 志文 件 等 内 容 。 

商业 价值 《Value): 通过 对 大 数据 的 控 据 ， 提 取出 巨大 的 商业 价值 和 社会 价值 。 

大 数据 就 是 通过 挖 据 和 分 析 ， 从 数据 中 提取 价值 的 过 程 。 形 象 地 说 ， 大 数据 束 是 在 沙里 
淘金 的 过 程 。 

对 大 数据 来 说 ， 主 要 包括 结构 化 数据 、 半 结构 化 数据 和 非 结 构 化 数据 。 

结构 化 数据 : 主要 存在 于 关系 型 数据 库 ， 目 前 是 主流 的 数据 类 型 。 

半 结 构 化 数据 : 主要 包括 电子 邮件 、 文 本 文件 等 内 容 。 

非 结构 化 数据 : 包括 社交 网 络 、 互 联网 和 移动 设备 产生 的 各 种 信息 ， 非 结构 化 数据 还 可 
以 是 各 种 的 音频 、 视 频 和 图 上 等 内 容 。 

大 数据 技术 可 以 高 并 发 的 对 海量 数据 进行 恋 写 、 存 储 ， 通 过 并 行 处 理 ， 还 可 以 快速 啊 应 
查询 和 分 析 。 它 文 持 高 效率 的 存储 和 得 询 ， 对 各 种 业务 的 变化 能 够 快速 地 响应 。 

大 数据 涉及 的 技术 ， 主 要 包括 : 海量 数据 存储 技术 、 实 时 数据 处 理 技术 、 高 速 传输 撤 术 、 
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搜索 技术 和 数据 分 析 技 术 等 。 下 面 我 们 主要 介绍 实时 数据 处 理 技术 ， 也 就 是 流 数据 的 内 容 。 
19.2 大 数据 的 处 理 技 术 之 一 一 一 流 数 据 


流 数据 是 一 组 顺序 的 、 大 量 的 、 连 续 的 数据 序列 ， 我 们 可 以 把 流 数据 看 做 一 个 随时 间 的 
变化 而 无 限 增长 的 动态 数据 集合 。 流 数据 处 理 拉 术 是 针对 大 数据 产生 的 分 布 式 集群 平台 ， 它 
可 以 提取 具有 商业 价值 的 信息 ， 它 主要 应 用 于 各 种 实时 分 析 。 例 如 实时 交易 分 析 、 情 感 分 析 
MRE. 

对 于 流 数 据 来 说 ， 它 强调 的 是 实时 处 理 与 分 析 ， 而 不 是 数据 存储 。 所 以 只 能 在 内 存 中 进 
行 处 理 ， 不 落 在 具体 的 磁盘 中 。 随 独 时 间 的 流动 ， 它 只 对 一 段 时 间 内 的 数据 进行 处 理 。 例 如 
流 数据 可 以 把 交易 系统 的 日 志 信 息 放 到 流 平台 中 ， 进 行 反 欺诈 和 各 种 实时 监测 。 流 计算 上 共有 
每 秒 百 万 级 别 的 流 数据 实时 处 理 能 力 ， 同 时 有 超 低 延 时 的 处 理 能 力 。 流 计算 可 以 很 快 地 对 海 
量 数 据 中 的 寞 党 行为 做 出 分 析 和 预测 。 


19.3 大 数据 下 的 数据 染 构 


在 大 数据 环境 下 的 数据 染 构 ， 如 图 19-1 所 示 : 











































结构 化 数据 分 析 应 用 


mx. 
KU. 


一 -2 一 


Ni 
Q 结构 化 元 数据 


Hadoop 平 台 
WE 
-— 


v 





图 19-1. 大 数据 环境 下 的 数据 架构 


首先 我 们 可 以 使 用 “网 络 改 虫 ” 手段 收集 非 结构 化 的 数据 ， 在 Hadoop 平台 中 建立 非 结 构 
化 信息 的 标签 、 摘 要 、 有 索引 、 日 和 六、 内容 等 ， 然 后 提取 结构 化 的 元 数据 信息 ， 例 如 类 别 、 摘 
要 等 内 容 ， 最 后 与 基础 数据 中 的 结构 化 数据 进行 整合 。 非 结构 化 数据 会 通过 结构 化 元 数据 和 
结构 化 数据 关联 。 

对 于 流 数 据 来 说 ， 它 强调 的 是 实时 处 理 与 分 析 ， 而 不 是 数据 存储 ， 它 可 以 把 交易 系统 的 
日 志 信 息 实 时 地 放 到 流 平台 当中 ， 进 行 反 欺诈 的 实时 监测 ， 流 计算 一 般 可 以 在 几 秒 钟 之 内 对 
海量 数据 中 的 异常 行为 作出 预测 和 分 析 。 
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总 乙 ， 对 于 基础 数据 来 说 ， 它 存储 的 都 是 有 用 的 信息 ， 可 以 被 比 做 黄金 ， 而 Hadoop 平台 
存储 的 则 是 从 网 络 中 搜集 来 的 沙子 ， 我 们 的 目的 就 是 将 沙子 里 的 黄金 科 选 出 来 。 

大 数据 的 一 个 重要 应 用 区 是 与 情 分 机 ， 即 利用 网 上 搜集 的 信息 ， 进 行情 感 分 机 和 预警 分 
析 。 例 如 正面 、 负 和 面 的 信息 ， 包 括 企业 的 声誉 分 析 、 吕 有 牧 分 析 、 服 务 质量 分 析 、 苋 搜 产品 分 
析 、 市 场 动态 跟 躁 等 内 容 。 

大 数据 的 处 理 流程 〈 见 图 19-2). 





”大 数据 的 采集 





fe 


Q 对 数据 的 统计 分 析 


@@ 对 数据 的 挖 可 


19-2 大 数据 的 处 理 流程 
OD 大 数据 采集 
可 以 利用 Oracle, Mysql, HBase 和 MongoDB 等 工具 接收 外 部 数据 。 
(2) 数据 统计 分 析 
利用 分 布 式 技 术 对 海量 数据 进行 租 询 和 汇总 计算 。 可 以 做 离线 数据 分 机 和 实时 统计 分 析 。 
(3) 数据 欣 据 
利用 挖掘 模型 对 数据 进行 分 析 。 








19.4 大 数据 在 银行 业 的 应 用 与 实践 








大 数据 在 银行 业 的 应 用 可 以 有 以 下 几 种 ， 如 图 19-3 所 示 : 


风险 与 其 诈 分 析 VEPER 


客户 风险 分 析 


客户 与 市 场 洞察 








图 19-3 ”大 数据 在 银行 的 应 有 
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与 情 分 析 

对 于 银行 来 说， 与 情 分 析 可 以 包括 : 银行 的 声誉 分 机、 品牌 分 机 和 服务 质量 分 析 。 主 要 
是 通过 分 析 网 络 社交 媒体 的 评论 ， 对 银行 客户 的 流失 进行 预 稚 ， 还 可 以 通过 对 新 闻 热 点 的 跟 
踩 和 政府 报道 的 分 析 ， 为 银行 提供 个 性 化 的 市 场 分 析 。 

客 己 信用 评级 

银行 可 以 通过 收集 客户 申请 信用 卡 的 数据 ， 分 析 客 户 的 信用 等 级 ， 从 而 帮助 业务 人 员 做 
出 决策 。 

客 尸 风险 分 析 

银行 可 以 通过 收集 客户 的 基本 信息 、 交 易 信 息 和 信用 信息 ， 对 这 些 海 量 数据 进行 挖 据 和 
分 机 ， 评 佑 客户 的 信用 风险 ， 从 而 降低 银行 的 风险 。 

客户 与 市 场 洞察 

银行 对 于 市 场 的 趋势 分 析 。 通 过 跟踪 社交 炬 体 的 评论 信息 ,利用 各 种 非 结 构 化 数据 ， 
增强 对 客户 的 细 分 ， 改 进 客户 的 流失 预警 模型 。 对 市 场 的 趋势 进行 分 机 ， 方 便 对 市 场 的 
ill £x o 

运营 优化 

主要 包括 对 系统 日 志 的 维护 和 故障 分 析 。 通 过 大 数据 平台 对 各 种 历史 数据 保存 和 管理 。 
同时 可 以 预测 系统 的 故 隐 ， 提 升 系统 的 运 介 效率 。 

风险 与 欺诈 分 析 

天 于 银行 的 风险 与 其 诈 分析 主 要 包括 : 财务 风险 分 析 、 贫 球 风 险 分析 、 各 种 反 洗钱 和 其 
诈 调 但 和 实时 欺诈 分 析 等 内 容 。 所 谓 财务 风险 分 析 是 通过 分 析 信 用 风险 和 市 场 风 险 产 生 的 数 
据 。 贷 款 风 险 分 析 是 从 媒体 或 者 社会 公共 信息 中 提取 企业 客户 和 潜在 客户 的 信息 ， 以 提高 风 
























































今 的 预测 能 力 和 预 蛇 能 力 。 所 谓 实时 欺诈 分 析 是 通过 对 大 量 的 欺诈 数据 进行 分 析 。 反 洗钱 与 
欺诈 调 伍 则 是 提取 犯 非 记录 的 信息 。 
随 看 银行 业务 的 扩展 ， 可 以 对 大 数据 进行 染 构 规划 ， 如 图 19-4 所 示 : 
数据 仓库 


应 用 


ES 


Hadoop 平 台 


图 19-4 大 数据 的 数据 染 构 规划 


大 数据 的 数据 染 构 规划 可 以 采用 Hadoop AR, 通过 与 结构 化 数据 的 关联 ， 进 一 步 拓 展 
对 非 结 构 化 数据 的 处 理 ， 其 数据 源 包括 结构 化 数据 、 半 结构 化 数据 和 非 结构 化 数据 。 非 结构 
化 数据 和 半 结 构 化 数据 通过 网 络 仆 虫 的 方式 被 搜集 , 再 经 过 内 容 省 理 的 处 理 , 将 非 结 构 化 数 
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据 、 半 结构 化 效 据 进 行 结构 化 处 理 , 然后 可 以 将 内 容 管 理 处 理 得 出 的 非 结 构 化 数据 元 数据 信 
县 存放 到 基础 数据 存储 中 。 对 于 Hadoop 平台 来 说 ， 它 是 基于 HDFS 存放 的 非 结构 化 数据 。 

大 数据 为 银行 创造 哪些 价值 

当 银 行 客 户 与 银行 发 生 交 易 的 时 候 ， 会 产生 大 量 的 数据 ， 这 些 数据 为 银行 进行 有 针对 性 
的 营销 创造 了 机 会 。 因 为 数据 隐 伟 看 大 量 的 业务 价值 ， 我 们 最 主要 的 工作 就 是 如 何 将 这 些 价 
值 挖 所 出来， 并且 加 以 利用 。 

在 大 部 分 的 应 用 中 ， 随 看 数据 量 指数 级 的 增长 ， 特 别 十 一 些 非 结 构 化 数据 的 快速 增长 ， 
这 些 海量 的 数据 会 导致 分 机 时间 的 延长 ， 传 统 的 商业 智能 已 经 进 入 到 了 一 个 瓶颈 当中 。 在 大 
数据 时 代 ， 这 些 问 题 逐 渐 成 了 阻碍 业务 肥 展 的 原因 之 一 。 

在 很 长 的 一 段 时 间 之 内 ， 银 行 的 大 多 数 业 务 部 是 建立 在 客 记 与 银行 的 交易 过 程 中 的 ， 例 
如 银行 开户 、 存 球 、 贫 于 等 业务 。 但 是 为 了 能 更 好 地 为 客户 服务 ， 仪 仅 依赖 这 些 交 易 数 据 是 
远 远 不 够 的 。 随 看 拉 术 的 进步 ， 银 行 可 以 通过 各 种 途径 收集 客户 的 资料 ， 例 如 通过 移动 终 闹 
搜集 客户 的 地 理 位 置信 息 ， 然 后 再 进行 有 针对 性 的 营销 。 

同时 随 看 互联 网 技术 的 发 展 ， 银 行 的 客户 可 以 通过 互联 网 或 者 其 他 电子 渠道 对 银行 业务 
发 表 看 法 ， 或 者 是 购买 银行 的 产品 。 这 些 操作 都 为 银行 了 解 客 户 创 造 了 条 件 ， 降 低 了 信息 的 
不 对 称 性 。 所 谓 信息 的 个 对 称 性 是 指 客 户 可 以 有 多 种 渠道 去 深入 了 解 银行 的 情况 ， 但 是 银行 
却 很 难 深 入 了 解 客 户 的 需求 ， 真 实 想法 和 目 且 的 资金 实力 。 现 如 今 ， 银 行 可 以 搜集 互联 网 的 
言 轧 ， 包 丘 客 户 购买 商品 的 信息 ， 然 后 去 分 析 客 户 对 产品 、 服 务 的 辟 好 ， 正 确 地 理解 客户 的 
需求 ， 从 而 有 针对 性 的 袁 销 ， 同 时 可 以 更 好 地 为 客户 服务 ， 为 银行 创造 更 多 的 利润 ， 并 且 从 
“以 业务 为 中 心 ” 问 “以 客户 为 中 心 ” 进 行 转变 。 

目前 来 说 ， 对 数据 的 分 析 已 经 逐渐 成 为 银行 实现 核心 业务 价值 的 重要 手段 之 一 。 特 别 是 
在 利率 市 场 化 的 趋势 下 ， 存 区 的 稳定 性 逐渐 降低 ， 同 时 存 贷 亚 利 兰 普 过 会 收 军 。 金 融 脐 尹 ， 
同样 会 导致 大 量 客户 的 流失 和 客户 忠诚 度 的 降低 。 银 行 作 为 “ 文 付 中 介 ” 的 垄断 地 位 已 经 动 
揪 ， 同 时 客户 对 银行 服务 的 要 求 越 来 越 局 。 银 行业 这 个 长 期 以 来 一 直 变 化 缓慢 的 行业 现在 应 
该 放下 “如 子 ”， 及 时 地 、 更 全 面 地 深入 了 解 客 户 的 基本 信息 ， 近 升 业务 运行 的 效率 ， 逐 步 提 
JEEP ISI e 

在 这 种 环境 下 ， 大 数据 为 我 们 市 来 的 价值 是 个 可 限量 的 。 这 些 大 数据 经 过 挖 据 和 加 工 之 
后 ， 可 能 为 银行 带 来 巨大 的 效益 。 特 别 是 商业 银行 ， 可 以 通过 分 析 用 户 关 于 网 银 的 使 用 习惯 ， 
将 该 用 户 最 第 使 用 的 功能 陈列 在 登录 界面 上 ， 省 去 了 用 户 在 末 单 跳 转 中 论 费 的 时 间 。 

对 于 银行 来 将， 风险 管控 和 用 户 营 销 是 未 来 最 重要 的 两 个 方向 。 而 对 客户 的 信用 评分 是 
实现 这 两 个 方向 的 重要 条 件 之 一 。 信 用 评分 是 根据 申请 人 提交 的 申请 信息 和 证 明 材 料 ， 或 者 
通过 其 他 渠道 获得 的 申请 人 的 信息 ， 例 如 交易 信息 、 还 球 信 息 、 缴 费 信息 、 客 户 资 产 情 况 等 
内 容 ， 帮 助 业 务 人 员 作 出 决策 ， 降 低 坏账 京 。 

我 们 举例 来 说 ， 可 以 基于 大 数据 的 分 析 和 人 查询， 特别 是 搜集 客户 的 地 理 环 境 、 年 龄 和 交 
易 辟 好 信息 ， 有 针对 性 地 为 客 尸 近 供 理财 产品 建议 和 捉 醒 ， 辣 时 通过 对 六 数据 的 分 析 和 挖掘， 
可 以 评 全 客户 的 信用 风险 和 资金 偿还 能 力 , 降低 银行 的 各 种 风险 。 关 于 大 数据 的 架构 如 几 19-5 
所 示 : 可 以 通过 大 数据 管理 平台 ， 搜 集 各 种 结构 化 数据 和 非 结 构 化 数据 ， 然 后 对 银行 的 声誉 、 
服务 的 质量 和 各 种 产品 进行 分 析 。 
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非 结构 化 数据 





图 19-5 大 数据 的 架构 
总 结 : ”2012 年 被 称 为 “大 数据 时 代 的 元 年 ” 电 商 业 、 人 金融 业 和 电信 行业 经 过 长 年 的 运 





营 ， 已 积累 了 大 量 的 数据 。 大 数据 分 析 可 以 实现 “以 业务 为 中 心 ” 同 “以 客户 为 中 心 ” 的 转 
变 ， 降 低 了 信息 的 不 对 称 性 。 对 于 金融 业 来 说 ， 大 数据 实质 上 意味 痢 巨大 的 商机 ， 可 以 用 来 
提高 客户 的 忠诚 度 ， 提 升 企业 的 形象 等 等 。 














19.5 Zkx E 





D 大 数据 具有 4V 的 特性 : 数据 量 (Volume)、 数 据 种 类 的 多 样 性 〈Variety)、 实 时 性 
(Velocity) 和 商业 价值 (Value). 

2) 对 大 数据 来 说 ， 主 要 包括 结构 化 数据 、 半 结构 化 数据 和 非 结构 化 数据 。 

3) 对 于 流 数 据 来 说 ， 它 强调 的 是 实时 处 理 与 分 析 ， 而 不 是 数据 存储 。 

4) 大 数据 在 银行 的 应 用 可 以 有 以 下 几 种 : 熏 情 分 析 、 客 户 信 用 评级 、 客 户 风 险 分 析 、 

客户 与 市 场 洞 察 、 运 营 优 化 、 风 险 与 欺诈 分 析 。 
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"B20€ 4m rpm M S BERDA 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 金融 行业 实施 商业 智能 的 背景 。 
e 疝 业 智能 在 金融 行业 的 作用 。 
e 金融 行业 实施 商业 智能 的 措施 。 





20.1 金融 行业 实施 商业 智能 的 背景 


商业 智能 是 一 种 提高 企业 智能 化 的 手段 ， 它 可 以 满足 企业 发 展 的 需要 ， 提 高 企业 的 竞争 
力 。 商 业 智能 提高 金融 行业 的 风险 管理 ， 提 升 对 外 服务 的 质量 ， 痢 能 起 到 关键 性 的 作用 ， 

在 市 场 竞争 和 银行 业务 转型 期 间 ， 商 业 智能 对 于 业务 和 内 部 管理 水 平 的 提升 起 到 了 重要 
的 作用 。 在 银行 数据 大 集中 的 背景 之 下 ， 商 业 智能 已 经 逐渐 成 为 战略 转型 的 选择 之 一 ， 如 何 
从 业务 和 技术 两 个 方面 推动 商业 智能 在 金融 行业 的 应 用 ， 已 经 成 为 当前 金融 行业 相关 人 员 最 
关心 的 内 容 之 一 。 


20.2 商业 智能 在 金融 行业 的 作用 


金融 行业 的 市 场 正 在 发 生 看 翻天 履 地 的 变化 ， 银 行 乙 间 的 竞争 日 瘟 加 剧 ， 利 率 市 场 化 已 
经 成 为 了 趋势 ， 面 对 痢 “ 人 金融 脱 妊 ”的 压力 ， 为 了 继续 在 市 场 中 立足 ， 丙 业 银行 也 只 有 利用 
强化 营销 、 控 制 日 增 的 风险 ， 才 能 保证 利润 的 增长 和 可 持续 发 展 。 

通过 实施 数据 仓库 系统 ， 丙 业 银 行 可 以 实现 账户 、 客 户 和 交易 数据 的 集中 和 统一 ， 实 现 
以 客户 为 中 心 的 市 场 化 营销 ， 改 善 营 销 的 手段 和 效率 ， 这 样 可 以 降低 成 本 ， 同 时 稳固 提升 客 
户 的 忠诚 度 和 满意 度 。 

商业 智能 是 商业 银行 应 对 市 场 竞 争 的 必要 选择 ， 它 可 以 贴近 行业 特殊 的 需求 ， 同 时 满足 
商业 银行 发 展 的 需要 。 商 业 智 能 的 应 用 领域 越 来 越 广泛 ， 除 了 满足 一 般 企 业 的 客户 关系 管理 、 
人 力 资源 浓 理 、 绩 效 浓 理 等 领域 外 ， 在 其 他 行业 也 得 到 了 初步 的 应 用 。 特 别 是 金融 行业 ， 它 
是 最 早 引 入 商业 智能 的 行业 之 一 ， 丙 业 乔 能 可 以 为 金融 行业 带 来 很 多 价值 ， 在 金融 行业 中 起 
到 了 重要 的 作用 : 

(1) 商业 智能 是 对 数据 的 搜集 、 官 理 和 分 析 的 过 程 ， 它 可 以 帮助 决策 者 获得 各 种 信息 和 
知识 ， 辅 助 蜗 层 领导 做 出 正确 的 决策 。 

(2) 商业 智能 由 数据 仓库 、 数 据 集 市 、 挖 据 和 OLAP 多 维 分 析 组 成 ， 它 上 共有 数据 分 析 、 
知识 挖掘 的 作用 。 商 业 智 能 可 以 帮助 商业 银行 提升 内 部 管理 水 平和 对 外 业务 扩展 的 能 力 ， 增 
强 银 行 的 产品 创新 和 抵抗 风险 的 能 力 ， 同 时 也 可 以 基于 历史 数据 对 各 种 风险 进行 预警 。 

(3) 商业 银行 可 以 通过 商业 智能 技术 ， 迅 速 抓 住 市 场 机 遇 ， 提 升 银 行 的 核心 营 争 力 。 
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(4) 商业 智能 可 以 提升 银行 的 服务 水 平 ， 创 造 有 竞争 力 的 金融 产品 ， 实 现 利润 的 最 大 化 。 

(5) 通过 商业 智能 技术 ， 可 以 帮助 商业 银行 对 业务 流程 的 管理 ， 实 现 各 种 分 析 。 通 过 建 
设 数据 仓库 ， 对 客户 的 基本 信息 进行 整合 ， 使 得 分 析 人 员 从 多 个 角度 对 指标 进行 分 析 。 

(6) 通过 商业 智能 技术 ， 商 业 银 行 可 以 整合 各 种 资源 ， 可 以 进行 成 本 分 析 和 控制 ， 包 括 
绩效 分 析 和 利润 分 析 。 通 过 评估 并 模拟 各 种 市 场 风 险 和 客户 信用 风险 ， 实 现 银 行 的 增值 服务 
和 对 客户 的 个 性 化 服务 。 


20.3 ”金融 行业 实施 商业 智能 的 措施 


商业 智能 的 实施 需要 蜗居 领导 的 重视 ， 它 的 实施 需要 投入 大 量 的 资源 ， 同 时 需要 结合 银 
行 的 战略 目标 ， 明 确 各 个 阶段 的 重点 。 

商业 智能 在 银行 的 应 用 过 程 中 ， 首 移 需 要 面 问 业务 ， 明 确 商业 智能 需求 的 关键 点 ， 为 商 
业 智 能 的 大 规模 开发 捉 供 经 验 ， 同 时 你 证 商业 智能 的 应 用 在 短期 内 可 以 发 挥 作用 ， 增 强 团 队 
建设 的 信心 。 

在 商业 智能 的 建设 初期 ， 需 要 IT 人 员 理 解 业务 的 实际 情况 ， 逐 步 开 展 数据 仓库 的 建设 ， 
完成 OLAP 和 数据 集 市 的 基础 架构 ， 最 后 形成 完整 的 商业 智能 架构 体系 。 

综 上 所 述 ， 商 业 智能 是 提高 银行 智能 化 的 手段 乙 一 ,通过 实施 规划 ， 有 针对 性 地 解决 难点 。 
























































20.4 本章 小 结 








1) 在 市 场 苋 征 和 银行 业务 转型 期 间 ， 丙 业 智 能 对 于 业务 和 内 部 管理 水 平 的 提升 起 到 了 重 
要 的 作用 。 

2) ERRAT ME B TREO IEEE ARREST TRIB SEA H a, AE EAT 
CERE TEA, FBITRDGPES "mE WEJ, Ag f 3mxETREAUDOLAE. [Mb Ri] (A 
有 利用 强化 营销 手段 ， 控 制 日 增 的 风险 每 手段 ， 才 能 保证 利润 的 增长 和 可 持续 及 展 。 

3) 商业 智能 可 以 为 金融 行业 市 来 很 多 价值 ， 在 金融 行业 中 起 到 了 重要 的 作用 。 
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PAR 电力 行业 商业 智能 概述 


本 章 目标 

学 习 本 章 后 ， 您 将 掌握 : 

e 建设 企业 级 数据 仓库 的 原因 。 

e 电力 行业 数据 仓库 的 执行 染 构 。 

e 数据 仓库 开发 的 阶段 、 任 务 和 流程 。 

e 数据 仓库 运 维 内 容 。 

e 电力 行业 数据 仓库 的 建设 方法 。 

e 效 据 仓 库 建 立 及 完善 的 工作 过 程 和 效 琳 。 
e 数据 仓库 优化 的 工作 过 程 和 效果 。 


21.1 电力 行业 面临 的 挑战 


电力 行业 面临 的 挑战 主要 包括 : 业务 挑战 和 拉 术 挑战 。 

业务 挑战 

(1) 分 析 系 统 仅 提 供 人 简单 的 报表 人 查询， 管理 人 员 无 法 从 企业 全 局 的 角度 进行 跨 业 务 和 多 
角度 的 分 析 。 

(20 分 析 系 统 来 目 于 各 目的 领域 ， 不 具备 路 业务 的 分 析 能 力 ， 可 能 存在 多 个 机 构 上 报 相 
辣 数据 的 情况 ， 会 导致 出 现 数据 不 一 致 的 问题 。 

(3) 缺乏 对 数据 的 高 级 分 析 应 用 ， 不 能 发 挥 数据 资产 的 价值 。 

技术 挑战 

(1) 各 个 业务 系统 相互 独立 ， 业 务 人 员 很 难 跨 系 统 、 跨 业务 的 分 析 ， 分 析 系 统 与 生产 系 
统 的 帮 合 性 较 强 ， 缺 乏 对 分 析 的 文 持 ， 相 同 数据 可 能 存在 不 同 的 版 本 ， 数 据 不 一 致 的 现象 很 
严重 。 

(2) 不 同业 务 系统 管理 各 目的 数据 ， 业 务 数据 的 含义 可 能 存在 不 一 致 的 解释 。 业 务 系统 
的 数据 质量 仿 低 。 

















21.2 建设 企业 级 数据 仓库 的 原 


a) 业务 原因 

缺少 统一 的 报表 和 指标 体系 规范 ， 缺 乏 明 确 的 数据 责任 体系 。 

(2) 技术 原因 

缺乏 规范 的 数据 染 构 ， 例 如 缺乏 明确 的 数据 定义 ， 数 据 分 布 不 合理 。 缺 乏 规 范 化 的 数据 
管理 机 制 。 
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21.3 ”电力 行业 数据 仓库 的 执行 染 构 


电力 行业 数据 仓库 的 执行 染 构 如 图 12-1 所 示 : 
源 系统 。” ” 数据 抽取 ”数据 存储 数据 访问 ” ”用 户 访问 


报表 








图 21-1 电力 行业 数据 仓库 的 执行 架构 


21.4 数据 仓库 开发 的 阶段 、 任 务 和 流程 
数据 仓库 开发 的 阶段 、 任 务 和 流程 如 图 21-2 所 示 。 
部 署 | NN 
测试 wu 
开发 -— EN 
设计 w-— ü 


分 析 





定义 计划 





01 02 03 04 05 06 


图 21-2 数据 仓库 开发 的 阶段 、 任 务 和 流程 





定义 计划 

定义 期 望 的 目标 和 项 目 实施 计划 ， 评 估 系 统 的 现状 能 力 和 可 交付 的 策略 。 

分 析 

定义 数据 分 析 需 求 ， 建 立 概念 模型 ,评估 项 目 风 险 ,制定 用 户 测 试 和 性 能 测试 计划 等 内 容 。 
设计 

设计 ETL 功能 ， 定 义 报表 详细 规范 ， 建 立 逻 辑 数据 模型 ， 制 定 ETL 测试 计划 等 内 容 。 
开发 

建立 ETL 开发 流程 ， 建 立 物理 模型 ， 安 装 开发 环境 。 
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测试 
完成 性 能 测试 和 用 户 测试 。 
部 署 
评估 部 署 条 件 ， 完 成 数据 转换 ， 发 布 应 用 程序 。 
21.0 ”数据 仓库 运 维 内 容 


数据 仓库 运 维 内 容 如 图 21-3 所 示 。 








图 21-3 ”数据 仓库 运 维 内 容 


备份 与 恢复 

数据 仓库 的 定期 备份 和 快速 恢复 是 仓库 运 维 的 重要 环节 ， 能 够 满足 未 来 数据 库 系 统 规模 
的 扩展 ， 将 对 系统 性 能 的 影响 降 到 最 小 。 

归档 与 恢复 

在 数据 仓库 中 ， 归 档 是 必要 的 运 维 活动 ， 随 着 数据 量 的 增加 ， 数 据 仓 库 需 要 对 详细 数据 
不 断 地 进行 备份 、 索 引 和 维护 工作 ， 增 加 了 系统 的 复杂 性 ， 对 系统 的 性 能 产生 了 洪 在 的 影响 。 

数据 仓库 不 能 永久 你 存 数 据 ， 系 统 可 以 将 历史 数据 归档 到 离线 存储 设备 上 。 

系统 监控 

数据 仓库 系统 的 建设 应 该 加 大 对 数据 库 使 用 情况 的 监控 ， 这 些 信息 可 以 帮助 管理 员 对 数 
据 库 进行 调整 以 满足 现在 和 未 来 数据 容量 的 需求 。 

容量 规划 

对 CPU、 内 存 、 便 盘 和 网 络 人 硬件 资源 容量 的 规划 是 非常 重要 的 工作 。 在 数据 仓库 系统 中 ， 
这 些 人 硬件 成 本 直接 影响 到 YT. 系统 的 总 体 成 本 ， 做 好 容量 的 规划 可 以 降低 IT 系统 的 成 本 。 提 
高 运营 的 绩效 。 

性 能 管理 

在 数据 仓库 架构 的 过 程 中 需要 考虑 系统 性 能 的 问题 ， 包 括 系 统 的 负载 、 大 文件 的 传输 、 
系统 备份 和 恢复 的 时 长 等 内 容 。 


21.0 电力 行业 数据 仓库 的 建设 方法 


数据 仓库 以 全 局 观点 为 基础 ， 采 用 业务 需求 为 驱动 的 深 动 式 开发 方法 。 如 图 21-4 所 示 : 
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图 21-4 滚动 式 开 发 方法 
对 于 数据 仓库 的 演进 方法 是 以 提 局 仓库 的 分 析 能 力 和 数据 整合 能 力 为 线索 ， 提 升 管 控 的 








能 力 ， 改 进 数 据 质 量 ， 提 升 数据 管理 能 力 。 它 的 过 程 如 下 所 示 : 
CD 采用 速 说 的 方法 (如 图 21-5 所 示 ) 
建立 领导 奋 询 系统 ， 首 先 完 成 对 重要 主题 的 建设 。 


ETL 








领导 查询 
业务 系统 





bd 


= | »* | kä 
j Ed 


图 21-5 GEHBSURUT] Z1 


(2) 数据 仓库 建立 及 完善 〈 如 图 21-6 所 示 ) 
挑选 重要 的 主题 进行 数据 仓库 建设 ， 然 后 不 断 地 完善 。 


ETL 












业务 系统 
a 
= 





综合 报表 
一 一 





图 21-6 数据 仓库 建立 及 完善 
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(3) 数据 仓库 优化 (如 图 21-7 所 示 ) 
当 数 据 仓 库 基 本 建成 之 后 ， 提 供 更 全 和 面 的 数据 分 析 和 数据 展现 ， 可 以 对 数据 进行 更 深层 
次 的 挖掘 。 

















领导 查询 











ETL s, 


"I 
i 





图 21-7 数据 仓库 优化 


速 赢 阶段 的 工作 过 程 和 效果 

(12 TNF 

a) 初步 实现 领导 查询 的 功能 。 

b) 建立 数据 仓库 的 开发 环境 、 执 行 环 境 和 运 维 环境 。 建 立 数 据 集 市 ， 采 用 成 熟 的 ETL 
工具 抽取 并 且 目 动 汇 总 。 和 初步 完成 统一 编 公 ， 统 一 指标 口径 。 

(2) 效果 

可 以 进行 基于 指标 的 查询 和 统计 ， 表 现形 式 主要 是 报表 、 图 形 等 。 但 是 对 明细 数据 的 分 
析 能 力 有 限 ， 缺 乏 对 多 维 分 析 的 文 持 。 对 于 整个 架构 来 说 ， 只 有 数据 集 市 ， 还 没有 建立 企业 
级 的 数据 仓库 。 保 证 数据 集 市 的 数据 能 够 自动 更 新 ， 领 导 可 以 每 日 得 看 到 最 新 的 数据 。 

数据 仓库 建立 及 完善 的 工作 过 程 和 效果 

(1) 工作 过 程 

a) 完善 综合 分 析 ， 包 括 营 销 分 析 、 财 务 分 析 ， 在 数据 仓库 中 建立 客户 、 产 品 和 财务 等 主 
题 的 物理 模型 。 

b) 建立 数据 源 到 数据 仓库 之 间 的 映射 和 关系， 将 源 数据 进行 转化 和 加 工 后 进入 到 数据 仓库 
中 。 同 时 建立 人 营销、 财务 等 数据 集 市 ， 并 且 实 现 数据 仓库 到 数据 集 市 乙 间 的 转换 。 

c) 建立 数据 质量 和 数据 标准 的 管理 团队 、 方 法 和 流程 。 对 数据 质量 进行 分 机 ， 实 施 数据 
安全 的 分 级 策略 ， 建 并 访问 权限 。 初 步 建立 运 维 染 构 ， 包 括 组 织 、 流 程 和 方法 。 

(2) 效果 

在 数据 仓库 中 进行 综合 分 析 ， 减 少 管理 的 成 本 ， 企 业 级 的 数据 仓库 已 经 初步 完成 ， 具 备 
一 定 的 数据 整合 能 力 ， 提 供 明 细 和 汇总 的 数据 ， 保 证 数据 的 准确 性 和 及 时 性 。 例 如 通过 对 电 
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量 、 电 费 和 电价 的 分 析 ， 帮 助 提升 对 电量 的 需求 预测 和 电价 的 制定 能 力 ， 全 和 面 了 解 用 户 的 缴 
费 情 况 。 从 而 提升 营销 集 略 的 有 效 性 ， 帮助 电力 企业 降低 成 本 和 费用 。 同 时 还 可 以 利用 OLAP 
技术 ， 深 入 地 进行 数据 分 析 。 

数据 仓库 优化 的 工作 过 程 和 效果 

ETE 

a) 完善 领导 查询 功能 和 剩 下 的 数据 分 析 功 能 。 

b) 在 数据 仓库 中 建立 剩余 主题 域 的 物理 模型 ， 建 立 源 数据 到 数据 仓库 的 映射 和 关系， 将 数 
据 源 转化 后 进入 到 数据 仓库 ， 并 且 实 现 数据 仓库 到 数据 集 市 之 间 的 转换 ， 使 得 数据 集 市 中 的 
日 标 全 部 由 数据 仓库 中 计算 得 来 。 在 管理 方面 ， 建 立 数 据 的 生命 周期 ， 提 高 数据 的 运 维 能 

(2) 效果 

从 数据 仓库 中 进行 综合 分 析 ， 减 少 管理 的 成 本 ， 通 过 建立 企业 级 的 数据 仓库 ， 形 成 企业 
范围 内 的 数据 整合 能 力 。 数 据 仓 库 可 以 实现 数据 分 析 和 报表 展示 能 力 。 在 优化 过 程 中 可 以 实 
现 更 丰富 的 数据 分 析 能 力 ， 运 维 效率 得 到 进一步 的 提高 。 
































21.7 7) 


D 数据 仓库 开发 的 阶段 、 任 务 和 流程 : 定 义 计划、 分析、 设计、 开发、 测试 、 部 壮 。 
2) 数据 仓库 运 维 内 容 : 备份 与 恢复 、 归 档 与 恢复 、 系 统 监控 、 容 量规 划 、 人 性 能 管理 。 
3) 数据 仓库 以 全 局 观点 为 基础 ， 采 用 业务 需求 为 驱动 的 滚动 式 开 友 方法 。 
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工具 f 


第 22 革 Informatica PowerCenter 工具 人 简介 


本 章 目标 

本 章 将 详细 介绍 Informatica PowerCenter 工具 的 使 用 方法 ， 包 括 PowerCenter Designer. 
Repository Manager. Workflow Manager. Workflow Monitor STREM, H TEKK 
其 各 种 功能 的 详细 说 明 。 在 学 习 完 本 革 后 ， 您 将 了 解 Informatica PowerCenter 各 个 组 件 的 功 
能 、 使 用 方法 等 ， 为 下 一 篇 的 深入 学 习 做 好 充分 的 准备 。 

学 习 本 章 后 ， 您 将 掌握 : 

€ Informatica PowerCenter 的 历史 。 

€ Informatica PowerCenter 的 特点 。 

€ Informatica PowerCenter 的 优势 。 

€ Informatica PowerCenter 的 工具 介绍 。 


224 Informatica PowerCenter 介绍 
1993 ^E, Informatica 公司 在 美国 加 利 福 尼 亚 州 成 立 ， 一 年 后 在 美国 纳 斯 达 克 成 功 上 市 ， 


2005 年 进入 中 国 ， 开 辟 亚 洲 最 大 的 营销 市 场 。 截 止 到 2010 年 其 市 值 大 约 为 6.5 亿美 元 ， 约 有 
1600 名 雇员 。Informatica 公司 的 总 部 大 楼 如 图 22-1 所 示 。 














22-1 Informatica 公司 的 总 部 大 楼 (位 于 美国 加 利 福 尼 亚 州 红木 市 ) 
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22.1.4 Informatica 的 特点 


1. 强大 的 多 种 数据 类 型 访问 能 

Informatica PowerCenter 允许 访问 多 种 数据 类 型 ， 包 括 : 

e 结构 化 、 非 结构 化 以 及 半 结 构 化 的 数据 类 型 。 

e 关系 、 大 型 主机 、 文 件 和 基于 标准 的 数据 。 

e 消 县 队列 数据 。 

Informatica PowerCenter 可 以 根据 企业 的 针对 性 需求 ， 对 多 种 数据 类 型 进行 操作 。 访 软件 
可 以 实时 、 批 量 和 通过 变更 数据 捕获 的 方式 来 操作 数据 ， 以 满足 企业 的 业务 需要 。 

2. 企业 级 的 数据 集成 解决 方案 

Informatica PowerCenter 不 仪 能 通过 提供 强大 的 ETL 抽取 -转换 -装载 ) 功能 ， 应 对 部 门 
级 的 数据 仓库 和 数据 集 市 的 各 种 需求 ， 还 能 提供 高 效 的 、 高 可 用 性 的 企业 级 数据 集成 解决 方 
案 ， 满 足 企 业 对 安全 、 人 性 能 、 扩 展 性 及 其 他 方面 的 多 种 需求 。 

e 组 件 的 可 重用 性 、 故 障 转 移 、 可 随时 进行 恢复 。 

e 文 持 网 格 计算 。 

e 动态 分 区 功能 。 

e 基于 元 数据 的 管理 。 

e 开放 的 、 蜗 扩展 性 的 。 

Informatica 不 只 是 一 个 单一 的 ETL 工具 ， 目 前 它 已 经 发 展 成 为 一 个 面 回 企业 级 的 、 成 熟 
的 数据 集成 方案 供应 商 。 

3. 强大 的 ETL 抽取- 转换- 洲 载 ) 功 能 

e 文 持 元 数据 驱动 的 灵活 组 件 染 构 。 

e 广 持 路 平台 的 大 数据 量 的 数据 抽取 。 

e 进行 复杂 的 数据 转换 ， 通 过 对 复杂 数据 关系 的 深入 齐 析 ， 达 到 对 业务 决策 数据 的 精确 

掌握 。 
e Huy. 
e 及 时 的 、 可 用 的 、 高 效 的 信息 共享 。 


22.1.2 Informatica 的 优势 


(1) 在 合适 的 时 间 提 供 正 确 的 信息 

e 实现 统一 、 实 时 的 数据 访问 ， 即 批量 、 接 近 实 时 或 者 实时 的 数据 访问 。 

e 在 整个 企业 内 提供 及 时 可 靠 的 数据 以 满足 分 析 和 运营 要 求 。 

e 为 数据 定义 、 数 据 继承 和 关系 捉 供 企业 范围 内 的 可 见 性 ， 并 且 提 高 数据 的 准确 性 和 一 
致 性 ， 以 增强 对 数据 的 信心 。 

e 回答 企业 关于 数据 的 问题 并 随时 为 它 提 供 所 需 的 高 质量 数据 ， 以 便 企 业 能 够 更 好 、 更 
友 时 地 作出 决策 。 

(2) 满足 企业 级 的 任务 关键 型 部 闭 要 来 

e 满足 企业 对 安全 性 、 可 扩展 性 和 性 能 的 要 求 ， 并 且 为 企业 的 数据 集成 方案 打下 基础 。 

e 泪 足 不 断 增 长 的 数据 需求 、 克 省 使 件 成 本 并 降低 与 数据 停 用 期 有 关 的 成 本 和 各 种 风险 。 
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e 借助 PowerCenter 的 ICC 级 安全 功能 来 降低 安全 漏洞 和 隐私 漏洞 的 风险 。 

(32) 提高 路 团队 的 工作 效率 并 加 强 路 职能 协作 

@ 有 效 协调 设计 人 员 ， 让 开发 人 员 和 管理 者 进行 高 效 的 团队 工作 。 

@ 可 重用 的 组 件 功能 。 

e 可 以 轻松 处 理 和 管理 复杂 团队 (其 中 的 成 员 具 有 不 同 的 角色 和 责任 ) 的 BI( 商 业 智 能 ) 
项 目 。 

e 通过 或 励 协 作 、 最 大 程度 地 降低 开发 复 洒 性 、 管 理 变更 影响 、 提 电工 作 效 率 以 及 缩短 
交付 时 间 的 方式 ， 降 低 IT 项 目 成 本 。 

(4) 成 熟 的 市 场 、 丰 富 的 经 验 以 及 众多 的 客户 群 

Informatica 公司 在 全 球 拥 有 4200 多 位 客户 ， 包 括 : 

e 84 家 “ 财 定 100 强 ” 公 司 。 

e 道琼斯 中 87% 的 公司 。 

e 20 个 国家 和 地 区 的 政府 机 构 。 

Informatica 公司 在 各 行业 的 成 绩 : 

e iui: 全 球 23 家 顶尖 电信 运营 商 中 的 18 家 。 

e 人 金融 服务 : EER 60 家 顶尖 金融 服务 商 中 的 44 家 。 

e 医疗 保健 ERR 11 家 顶尖 医疗 保健 机 构 中 的 9 家 。 

e 能 源 与 公用 事业 : EER 34 家 顶尖 机 构 中 的 25 家 。 

e 保险 : 全 球 22 家 顶尖 保险 公司 中 的 18 家 。 

e 生命 科学 : 全 球 最 大 的 11 家 机 构 。 
































22.2 Informatica PowerCenter 工具 概况 


Informatica PowerCenter 工具 由 以 下 部 分 组 成 。 

€ Administration Console (EHE): 主要 负责 管理 Informatica 服务 、 目 录 、 域 、 市 
扩 、 日 志 、 账 户 等 信息 ， 基 于 B/S 结构 。 

€ PowerCenter: 用 来 进行 设计 ETL 开发 的 工具 ， 包 括 数 据 源 、 目 标 数据 库 、 英 射 方法 
等 的 定义 及 使 用 。 

@ Repository Manager: 主要 用 来 进行 资源 库 的 管理 、 安 全 性 的 管理 等 。 

€ Workflow Manager: 主要 用 来 进行 工作 流程 的 设计 。 

€ Workflow Monitor: 用 来 监控 、 管 理工 作 流 程 及 任务 ， 记 录 会 话 、 工 作 流 程 日 坊 等 信息 。 











22.9 Informatica Servers 5 |2% 


Informatica PowerCenter 的 服务 引擎 的 局 动 方式 如 下 : 

“开始 ”一 “控制 面板 ”一 “管理 工具 ”一 “服务 ”一 “Informatica PowerCenter 8.1.1”, 
进行 司 动 即 可 ， 如 图 22-2 Bp. 

服务 局 动 之 后 ， 即 可 进行 其 他 客户 问 管 理工 具 的 连接 使 用 ， 如 Workflow Manager〈 工 作 
流 管 理 器 ) 工具 的 打开 。 
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XFO REA 查看 WW) WW 


«€ 2 MFB S BE » m i mw 

































5o 服务 GEH s BZ (+b) 
Informatica Services 8.1.1 Ad / 描述 状态 ”启动 类 型 ” 登录 为 ， be 
is Human Interface Device Access 启用 对 智能 界面 设 ... 已 禁用 本 地 系统 
停止 此 服务 y IMAPI CD-Burning COM Service FH Image Masterin... 已 禁用 本 地 系统 
就 忆 动 此 服务 Si Informatica PowerCenter Metadata Manager Sch... 自动 本 地 系统 
Informatica Services 8.1.1 Informatica Services BEz Bz) 本 地 系统 
描述 : Si Informati ca 811 Jboss informatica 手动 本 地 系统 
Informatica Services SiS IPSEC Services 管理 IF 安全 策略 ... 已 启动 ”自动 本 地 系统 
Si Logical Disk Manager 监测 和 监视 新 硬盘 .. . 手动 本 地 系统 
Ai Logical Disk Manager Administrative Service 配置 硬盘 驱动 器 和 . . . 手动 本 地 系统 
SyMachine Debug Manager 支持 对 Visual Stu... 手动 本 地 系统 
Sans Software Shadow Copy Provider EREKE RIRS... 手动 本 地 系统 
A Net Logon 支持 网 络 上 计算 机 ... 手动 本 地 系统 
Sy Network Access Protection Agent 允许 Windows EP... 手动 本 地 系统 
Sy Network Connections EE “PMS... 已 启动 ”自动 本 地 系统 
Si Network DDE 为 在 同一 台 计算 机 ... 已 禁用 本 地 系统 
Hia Network DDE DSDM 管理 动态 数据 变换 ... 已 禁 本 地 系统 | 
Sy Network Location Áwareness (NLA) 收集 并 保存 网 络 配 .. . 已 启动 ”自动 本 地 系统 E 
Sio Network Provisioning Service 涛 自动 网 络 提供 管 ... 手动 本 地 系统 
SB. NT LM Security Support Provider HERAA... 手动 本 地 系统 
S O£fice Source Engine 可 保存 用 于 更 新 和 . . . 手动 本 地 系统 
Sis Or acleDBConsoleorcl 已 启动 ”自动 本 地 系统 
Si 0racleJobSchedul erORCL p 本 地 系统 3 
Si OracleOraDbiOg homeliSQLkPlus iSQLKPlus Applica... 已 启动 ”自动 本 地 系统 
Syr acleÜraDbiO0g homelTNSListener 已 启动 ”自动 本 地 系统 
Syor acleServiceÜRCL 已 启动 ”自动 本 地 系统 
Si Performance Logs and Alerts 收集 本 地 或 远程 计 .. . 手动 网 络 服务 
SisPlug and Play 使 计算 机 在 极 少 或 ..， ”已 启动 ”自动 本 地 系统 
Si Portable Media Serial Number Service Retrieves the ser... 手动 本 地 系统 
Si Print Spooler 将 文件 加 载 到 内 存 .. . 已 启动 ”自动 本 地 系统 
Sis Protected Storage 提供 对 敏感 数据 O0... 已 启动 ”自动 本 地 系统 
Hyos RSVP 汶 依 束 质 量 服 务 Qo... 手动 本 地 系统 
Si Remote Access Auto Connection Manager 3utftABHESS X... 手动 本 地 系统 
Sis Remote Access Connection Manager 创建 网 络 连接 。 已 启动 ”手动 本 地 系统 
Sis Remote Desktop Help Session Manager 管理 并 控制 远程 协 ... 手动 本 地 系统 M 


| | all 


22-2 Informatica PowerCenter 服务 


22.4 Administration Console 


Informatica PowerCenter Administration Console 是 一 个 对 域 进行 管理 的 工具 。 通 过 浏览 
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管理 ， 如 图 22-3 所 示 。 


Informatica PowerCenter Administration Console — indows Internet Explorer 


THO REO SEV KERA IAW MAW 











SO Y n http: //localhost:B001/adminconsole/Domains. do kz | n [x] | 百度 
3 d e Informatica PowerCenter Administration Co... e = y 一 * IET: us UO 工具 (0) ~ 


About Logout 








Informatica PowerCenter Administration Console Re oF Tia 


| Domain | Logs Administration Upgrade Manage Account 
Legend 


* B Details for domain: Informatica Domain 


$9 PowerCenter Integration Service Last updated:Z# 0 = 31 09:20:55 2007 
Eg PowerCenter 
€. License WWW-CF63808936C 8356 











| EB PowerCenter 











@ @ Localhost Node01 
v Yv 


| 3 PowerCenter I... 























Ir T7 Internet 
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22.4.1 登录 方式 


首先 介绍 控制 台 服 务 的 登录 方式 。 
打开 浏览 器 ， 在 地 址 栏 里 输入 : http://localhost:6001/; 进入 到 如 图 22-4 所 示 的 页 面 中 。 








Informatica PowerCenter Adninistration Console — Findows Intern... 回回 因 
THO dB) EGO RERA IAD $B500 


IE | http: //localhost:5001/adminconsol: V | 好 X 


= page 














Le] 
w - 已 页面 @) - GIRO. ” 


BE 








b des 


D i L1 |Æ Informatica PowerCenter Admi... 

















Help About 


Informatica PowerCenter Administration Console 


Login 





Username: 











Password: 





INFORMATICA 


PowerCenter Administration Console 





| | &» Internet 


22-4 [Informatica PowerCenter Administration Console 登录 页 面 


登录 之 后 ， 即 可 进入 到 Informatica PowerCenter Administration Console， 如 图 22-5 所 示 。 























Informatica PowerCenter Adninistration Console — Windows Internet Explorer PREIE3 
AEQ) aD SEVU RERA IAM 大助 
Go v rn http: //localhost:8001/adminconsole/Domains. do v | 他 | X | 百度 | 四 I 
| 一 一， p$ » 
* d Æ Informatica PowerCenter Administration Co... | | t^ z dh E cr 页 面 (p- Q IR ~ 








Informatica PowerCenter Administration Console 


Administrator Help About Logout 


Upgrade Manage Account 





| Domain EE 


Administration 


Legend 


—— Log Management 


72 PowerCenter Integration Service Last updated:E £i z E 26 13:26:10 2007 
eg PowerCenter 
Q License WWW-CF63B08936C 8356 


* B Details for domain: Informatica Domain 








t node01 
| 








Q Localhos 
gr] 





| Eg PowerCenter 








g 


| 3e PowerCenter I... 








Ii | 


& 1008 ~ .: 


| | _ | Internet 
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22.4.0 NE 
下 面 介绍 涉及 的 术语 。 


22.9 





5X (Domain): 是 节点 (Node) 和 服务 (Service) 集合 在 一 起 的 管理 单元 ， 可 支持 分 

布 式 架构 。 域 (Domain) 包括 服务 (Services)、 节 点 (Nodes)、 序 列 写 (Licenses). 

XFX (Folders) 和 网 格 (Grids)。 

节点 《Nodes): 是 一 个 物理 的 或 者 网 辑 的 单元 ， 可 以 是 一 侣 服务 器， 也 可 以 是 一 个 虚 

拟 机 。 

服务 〈Services): 在 域 中 的 服务 (Services) 包括 服务 党 理 (Service Manager) 和 应 用 

服务 (Application Services). 

序列 号 〈Licenses): 主要 描述 了 软件 的 使 用 期 限 。 

FR (Folders): HI2K2H Z0 RIVE BEAR TEPRIE. FRP ER Bk. (Nodes), 

服务 (Services)、 网 格 CGrids). F3 (Licenses) 和 其 他 文件 夹 CFolders) . 

网 格 (Grid): 在 集群 上 运行 会 话 〈Sessions) 和 工作 流程 (Workflows). TEZ Ah 7H A 

(Nodes) 上 可 以 运行 集成 服务 CIntegration Service )。 当 在 一 个 网 格 上 运行 工作 流程 或 
会 话 时 ， 进 程 将 在 多 个 节点 之 间 运 行 。 











PowerCenter Designer 





PowerCenter Designer OXIME EAr), 为 ETL (抽取 -转换 -装载 ) 过 程 提 供 源 数据 的 定义 、 
目标 数据 的 定义 、Mapping 上 映 射 规则 的 定义 功能 ， 帮 助 设 计 人 员 及 开发 人 员 进 行 数据 业务 的 
设计 及 开发 工作 ， 如 图 22-6 所 示 。 
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D Informatica PowerCenter Designer - [Mapping Designer - Test - [Example]] - [Bl x| 
8» Repository Edit View Tools Layout wersioning Mappings Transformation window Help -|[81 x| 
SA URB Test - [Example] » ma a R à qaos wes ER E p e e. a WOES u Op 7D 
e[oloo [k] AR «*z2.mu»&4dbü8 B 43e9:smsos [ERES S Uo» 
Repository Navigator -x 
5 E lel -Y 
B Repositories 2^ = B co) E minis 
E- 8 Example Soong hesisuec ^ 
日 … 六 Test xS P x 
六 Business Components 
-- f Sources 
B- B orcl 
"b BONUS 
"Bb COUNTRY 
日 
ARGI 
(2 Cubes 
(2 Dimensions 
(2 Transformations 
(2 Mapplets 
B- 入 Mappings 
Hyg Examplei 
& Rep 
B wf 
TI E 





图 22-6 PowerCenter Designer 界面 


PowerCenter Designer LHH UDIK LEES. SeNu. LEKA h TR D. 
22.5.1] É 


1) Repository: 主要 实现 资源 库 的 连接 、 断 开 ， 导 入 、 寻 出 对 象 ， 打 印 、 保 存 等 功能 ， 
如 图 22-7 所 示 。 
2) Edit: 主要 实现 开发 过 程 中 的 复制 、 粘 贴 、 删 除 、 碍 找 、 符 换 等 操作 ， 如 图 22-8 Bron. 





=n Disconnect 
局 add... 


Configure Domains... 


Fage Setup... 
i: Copy Ctrltc 


Print Setup... 
Exit a Select All 


图 22-7 PowerCenter Designer Repository 3 ff. 图 22-8 PowerCenter Designer Edit 5i f. 


3) View: 主要 进行 可 视图 的 切换 ， 例 如 状态 栏 的 显示 和 隐藏 、 全 屏 等 ， 如 图 22-9 所 示 。 

4) Tools: 主要 有 以 下 功能 : ETL 过 程 中 不 同时 期 工作 区 的 切换 ; 打开 其 全 Informatica 
客户 器 工具 , 比如 Workflow Manager 等 ; 洛 户 目 定义 视图 设置 ; 用户 目 定义 函数 等 , 如 图 22-10 
所 示 。 








ue» Source hnalvrer 
[ig Target Designer 
Ep Transformation Developer 
E Mapplet Designer 
a» Mapping Designer 
R) Repository Manager 
= Status Bar P Designer 
Havigator 四 Workflow Manager 
L-] utpat Q Workflow Monitor 
Debugger + e Bdueries 
Üptions... 
站 Workbook H Customize... 
Sy Properties... ContentMaster Studio 
图 22-9 PowerCenter Designer View 3i£ f. 图 22-10 PowerCenter Designer Tools 5 FF. 





5) Layout: 主要 进行 放大 、 缩 小 ， 排 列 等 布局 的 设置 ， 如 图 22-11 所 示 。 
6) Versioning: 是 版 本 控制 采 单 ， 主 要 实现 检 入 、 检 出 ， 版 本 对 比 等 功能 ， 如 图 22-12 
所 示 。 
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= Iconize 


Ed Restore 


Zoom Center d 
Zoom Point + 
Zoom Rectangle 

Loom Normal 

Scale To Fit 


bE 


Zoom Percent + 


Arrange... 
Árrange All 
Árrange All Iconic 


gf a" gri gri 


Copy Columns 


Link Columns 


^ Autolink.. 
= BAutolink by Hame 
^ BAutolink by Position 


P S ds 


图 22-11 PowerCenter Designer Layout zz f. 图 22-12 PowerCenter Designer Versioning 3 £f. 








HE: DÀ BOECROISZ RISE ER, IPX ETL 过 程 的 不 同时 期 。 
1) Sources: 用 于 导入 源 数 据 ， 比 如 关系 型 数据 库 、 文 件 类 型 、XML、SAP、WSDL 等 


类 型 数据 ， 如 图 22-13 所 示 。 


2) Targets: 用 于 导入 目标 数据 (可 以 从 关系 型 数据 库 、 文件、 XML, SAP, Tibco, WSDL 
等 类 型 数据 导入 )， 创 建 、 编 辑 维度 ， 创 建 、 编 辑 立方 体 等 ， 如 图 22-14 所 示 。 


|- Import from Database... 

= Import from File... 
Import from Cobol File... 
Import AML Definition... 


Frofiling k 
Import From SAF... 
SAP Functions... 


Import From PeopleSoft ... 
Import from Siebel ... 

fts Import from WSDL Consumer]... 
Import from WSDL (Frowider) ... 
Import from FowerExchanee... 


Import from Salesforce. com... 


Create... 


Edit... 


Bi NE. 


Compare... 


图 22-13 PowerCenter Designer Sources 3#% 


Import From SAP BW... 
Import TIBCD... 

fts Import from WSDL (íConsumer]... 
Import from ASIL Provideri ... 
Import from FowerExchange... 


Import from Salesforce. com... 





器 
e Compare... 


ul Create/Edit Dimension... 
m Create Cube... 

g Edit Cube... 

E Close Cube 


图 22-14 PowerCenter Designer Targets 菜单 





3) Transformation: 主要 实现 导入 存储 过 程 、 创 建 转换 定义 等 功能 ， 如 图 22-15 Bp. 
4) Mapplets: 主要 实现 可 重用 组 件 操作 功能 ， 例 如 创建 、 编 辑 、 删 除 、 验 证 、 依 赖 、 比 


较 等 操作 ， 如 图 22-16 所 示 。 
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Create... 


Import Stored Procedurs.. 


Import External Pracedure.. 


Create... EF Compare... 


r Compare... 
EE Profiling + 


Create Mapplet for Siebel Calculated Fields.. 


图 22-15 PowerCenter Designer Transformation 3 Hf 图 22-16 PowerCenter Designer Mapplets 5 FF. 


5) Mappings: 是 映射 规则 的 定义 、 编 辑 、 删 除 、 验证 等 操作 菜单 ， 如 图 22-17 所 示 。 
6) Window: 主要 实现 新 建 窗 口 ， 级 联 层 著 等 窗口 切换 显示 功能 ， 如 图 22-18 Pr. 








HH Create... 
Copy hs... 
Edit.. 
Close 
Delete 
Validate 


Ix Iu 


Dependencies... 
Fropagate Attributes.. 
TT Expand/UnExpand.. 


"n Compare.. 


"5 Parameters and Variables.. 
Metadata Extensions... 


=] Target Load Flan... Hew Window 


Stored Procedures Flan... 
Cascade 


Generate SAP RFC/BAPI Mapping... Tile 
Generate BCI Mapping... 
Generate and Install SAP R/3 Code.. 


Arrange Icons 


Cleaning ABAF Program Information... Results View List... 


Import from Data Federation Server... 1 Start Fage 
Wizards k 2 Mapping Designer - Fire - [PowerCenter] 
Debugger + Windows 

图 22-17 PowerCenter Designer Mappings 3 ff. 图 22-18 PowerCenter Designer Window 3€ !f. 








7) Help: 主要 实现 显示 Informatica 的 文档 、 版 本 信息 等 功能 ， 如 图 22-19 所 示 。 


Contents 
Tip o£ the Day 
Start Page 


Ábout Informatica Designer... 


图 22-19 PowerCenter Designer Help 5i FF. 


22.5.2 ”工具 位 
有 关 PowerCenter Designer 工具 栏 的 介绍 见 表 22-1. 
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表 22-1 PowerCenter Designer 工具 栏 


PowerCenter Designer 


WorkFlow Manager 
WorkFlow Monitor 


Repository Manager 


Update Strategy Transformation 





Expression Transformation 
Filter Transformation 


Aggregator Transformation 
Lookup Transformation 


Rank Transformation 
Mapplet Input 
Mapplet Output 


MQ Source Qualifier Transformation 
Application Multi-Group Transformation 
SAP/ALE IDoc Interpreter Transformation 


SAP/ALE IDoc Prepare Transformation 
SAP DMI Prepare Transformation 


Flexible Target Key Transformation 


HTTP Transformation 





jh — XS 

打开 Repository Manager 工具 操作 ， 如 当前 工具 用 户 已 登录 ， 则 
以 当前 用 户 登 录 

如 当前 工具 不 是 PowerCenter Designer， 则 将 其 打开 。 知 当 表 工具 
用 户 已 登录 ， 则 以 当前 用 户 登 录 

打开 WorkFlow Manager， 如 当前 工具 用 户 已 登录 ， 则 以 当前 用 户 
uK 

打开 WorkFlow Monitor， 如 当前 工具 用 户 已 登录 ， 则 以 当前 用 户 
登录 

更 新 策略 转换 组 件 (Update Strategy Transformation)， 主 要 实现 插 
入 Insert)、 更 狐 (Update), MIER (Delete) 和 拒绝 (Reject) 等 更 
LIBUS 

用 表达 式 方 式 来 实现 源 数据 的 转换 业务 ， 主 要 功能 为 基于 单行 记 
录 的 表达 式 计 算 

主要 实现 条 件 的 过 小 功能 

实现 源 数 据 在 转换 为 结果 过 程 中 的 聚合 功能 ， 比 如 汇总 、 平 均值 
Aj 


于 





主要 功能 为 售 找 相关 的 值 ， 然 后 传递 给 其 他 的 对 象 


当 目 标 表 中 有 目 动 增值 键 时 ， 使 用 该 组 件 在 插入 目标 表 数 据 时 会 
目 动 对 key 增加 ， 即 产生 一 组 唯一 的 序列 号 值 


导入 存储 过 程 

调用 一 个 或 多 个 外 部 定义 的 过 程 

该 组 件 主要 操作 外 部 建立 的 过 程 

类 似 于 数据 库 脚本 语言 SQL 语句 中 的 join on 关键 字 

主要 功能 为 对 源 数 据 进 行 格式 化 ， 例 如 将 一 行 数 据 分 多 行 显示 

主要 输出 位 于 最 底层 或 最 项 层 的 多 个 数据 的 集合 ， 起 到 排序 记 
录 的 作用 

传输 数据 到 可 重用 组 件 中 

从 可 重用 组 件 传输 数据 到 映射 

主要 功能 为 按照 条 件 分 组 来 过 滤 数 据 

基于 键 字段 进行 顺序 或 倒序 的 排序 操作 

主要 进行 控制 事务 的 一 系列 操作 ， 例 如 提交 、 回 深 

功能 为 从 源 表 中 得 询 出 所 有 的 数据 

该 组 件 定义 了 在 一 个 会 话 期 间 读 取 的 数据 元 素 

当 运 行 一 个 工作 流 时 ， 该 组 件 展示 抽取 的 行 集 

该 组 件 可 以 确定 Integration Service 如 何 从 MQSeries 消息 队列 源 
数据 中 读 取 数 据 

该 组 件 可 以 确定 Integration Service 如 何 读 取 TIBCO 源 数 据 


该 组 件 处 理 从 SAP 系统 接收 来 的 IDoc 数据 

该 组 件 只 能 为 特定 的 IDoc 类 型 解释 数据 。 在 单个 映射 中 ， 可 能 包 
括 多 个 该 组 件 来 展示 多 种 IDoc 类 型 

该 组 件 从 映射 和 分 段 数据 的 上 游 组 件 中 接收 数据 

该 组 件 用 于 开发 类 似 于 邮件 系统 的 案例 ， 比 如 邮件 已 经 发 出 但 是 
收 件 人 的 地 址 已 经 更 新 的 情况 

该 组 件 允 许 连 接 到 一 个 HTTP 的 服务 器 并 使 用 它 的 服务 和 应 用 。 
当 使 用 该 组 件 允 许 一 个 会 话 时 ，Integration Service 连接 到 HTTP 服 
务 并 发 出 一 个 请 求 ， 具 体操 作 是 获取 数据 还 是 更 新 数据 ， 取 决 于 在 
该 组 件 的 配置 中 选择 了 Read Data on the HTTP Server 还 是 Update 
Data on the HTTP Server 









































该 组 件 提供 了 创建 Web Services 客户 端的 3 种 方式 : 从 远程 的 基 
uL Web Services Consumer Transformation T URL 的 WSDL 文件 导入 、 从 本 地 的 WSDL 文件 导入 以 及 从 远程 
的 基于 UDDI 目录 的 WSDL 文件 导入 
. 该 组 件 处 理 外 部 的 SQL 脚本 或 者 SQL 查询 。 有 两 种 模式 : 脚本 
: MOSS MM 
U E N EA 进行 从 多 数据 源 中 合并 数据 到 目标 数据 的 操作 , 类 似 于 SQL 语言 
中 的 Union all 关键 字 


与 Java 程序 开发 语言 的 功能 定义 提供 了 一 个 简单 的 本 地 接口 。 
使 用 该 组 件 ， 可 以 在 不 具备 Java 开发 语言 的 知识 或 者 没有 额外 的 
Java 开发 环境 的 情况 下 ， 实 现 一 个 简单 的 、 适 度 复杂 的 Java 程序 
转换 功能 

一 个 简单 的 XML 源 数 据 抽取 功能 。 该 组 件 允许 从 消息 系统 〈 例 
如 TIBCO 或 者 MQ Series) 和 其 他 数据 源 〈 例 如 文件 或 者 数据 库 ) 
中 抽取 XML 数据 ， 并 逐 行 读 入 ， 进 行 剖 析 、 传 递 数据 。 例 如 ， 可 
以 从 TIBCO 源 数 据 中 抽取 XML 数据 , 然后 传递 给 关系 型 目标 数据 


该 组 件 的 功能 与 XML 齐 析 器 转换 组 件 〈XML Parser Transfor- 
ux XML Generator Transformation mation) 相反 。 例 如 ， 可 以 从 关系 型 目标 数据 中 抽取 XML 数据 并 传 
递 给 目标 数据 


该 组 件 允许 从 非 结构 化 源 数据 中 抽取 数据 并 进行 转换 。 例 如 ， 可 
以 使 用 该 组 件 从 Microsoft Word. Microsoft Excel. Microsoft 
PowerPoint, Adobe PDF 等 ， 以 及 特殊 的 工业 标准 的 格式 〈 如 
ACORD、FIXML 等 ) 抽取 数据 





E Java Transformation 








3s] XML Parser Transformation 





5 Unstructured Data Transformation 





PowerCenter Designer 的 组 件 (Transformation) 是 Informatica 的 重要 组 成 部 分 ， 所 有 的 数 
据 抽 取 操 作 都 是 由 以 上 组 件 构成 鸭 ， 访 者 需要 部 练 笃 握 。 


22.5.3 ”导航 














PowerCenter Designer 导航 如 图 22-20 所 示 。 
每 个 目录 都 由 以 下 几 部 分 组 成 。 



































|Reposltory Navigator - X 
S Repositories 
口 … @ Example 
E Ø Test 
的 Business Components 
E £9 Sources 
H- [BB orci 
"b BONUS 
"b COUNTRY 
V DEPT 
“ 命 EMP 
“ 命 SALGRADE 
日 … f Targets 
"4 
总 Cubes 
(D Dimensions 
总 Transformations 
(2  Mapplets 
H- f Mappings 
Yo Examplei 
& Rep 
wf 








图 22-20 PowerCenter Designer 导航 
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Business Components (业务 组 件 )。 
Sources 〈 源 数据 )。 

Targets (目标 数据 )。 

Cubes (立方 体 )。 

Dimensions (维度 )。 
Transformations (转换 组 件 )。 
Mapplets〈 可 重用 组 件 )。 
Mappings CHART. 


22.54 工作 区 


PowerCenter Designer 工作 区 如 图 22-21 所 示 。 

TARDU F STk ERE. 

€ Source Analyzer: 进行 源 数据 的 设计 、 显 示 等 操作 。 

€ Targets Designer: 进行 目标 数据 的 设计 、 显 示 等 操作 。 

€ Transformation Designer: 进行 组 件 的 设计 操作 。 

€ Mapplets Designer: 进行 可 重用 组 件 的 设计 操作 。 

€ Mapping Designer: 映射 规则 的 处 理 ， 源 数据 到 目标 数据 的 转换 过 程 中 的 规则 定义 。 


- 


3 p TETI " 
A | Ls E3 

( (| 

CIPIT QE 4d Pong, 
| 9 IAJ. ' | rfÉrvryg- | 



































图 22-21 PowerCenter Designer 工作 区 
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22.5.5 ”输出 窗口 


PowerCenter Designer 输出 窗口 如 图 22-22 所 示 。 


Dutput Window l x| 


Parsing mapping Examplel... 
... parsing completed with no errors. 


Hok Mapping Examplel is VALID 六 冰冰 冰冰 六 六 六 
mapping Examplel inserted. 





...data flow validation completed with no errors. 


m 
加 到 加 


图 22-22 PowerCenter Designer 输出 窗口 


输出 窗口 包括 以 下 7 个 选项 卡 。 
当 进 行 你 存 操作 时 ， 
Fetch Log: 获取 日 志 输 出 信息 。 


Save: 





Generate: 


于 快速 地 会 找 出 问题 的 根源 所 在 。 
调试 信息 的 输出 。 


Debugger: 





输出 创建 对 象 的 日 志 信 息 。 
Validate: 验证 信息 的 输出 。 如 果 在 验证 过 程 中 出 错 ， 


Session Log: Session 日 志 的 输出 显示 。 





Notifications: 


22.0 Repository Manager 


Repository Manager (9t 





AIE EZS) 主要 对 Repository 库 进 行 管理 ， 


该 输出 将 显示 已 你 存 的 具体 操作 信息 。 


请 仔细 查看 该 错误 输出 信息 ， 便 


该 输出 将 显示 连接 资源 库 的 相关 信息 ， 比 如 成 功 、 失 败 等 。 


包括 安全 性 管理 。 例 





如 ， 文 件 夹 的 创建 、 用 户 访问 权限 、 安 全 以 及 密码 的 管理 等 内 容 ， 如 图 22-23 所 示 。 


Informatica PowerCenter Repository Manager = 





[Example] 


Repository Edit View Folder Versioning Security Analyze Tools Windows Help 


Telo o o 
[Repository Navigator x 
& Repositories 
H- Bb Example 
(2 Deployment Groups 
日 … @ Test 























B 
"b DEPT 
"b EMP 
"b  SALGRADE 
Targets 
Mappings 
Sessions 
workflows 
(2 Configurations 























-E-E]-EE EE 
S3 S SS 




















date 


m: 38 0 NOT A KEY nct 
19 NOT å KEY nc 
varchar2 50 NOT A KEY nc 


0 
0 
number 15 0 
varchar2 50 0 





























图 22-23 


PowerCenter Repository Manager 35H 
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22.6.1 z% 


1) Repository: 主要 实现 资源 库 的 连接 、 断 开 ， 添 加 知识 库 、 配 置 域 ， 导 入 、 导 出 对 象 ， 
村 入 、 导 出 元 数据 等 功能 ， 如 图 22-24 所 示 。 

2) Edit: 主要 完成 开发 过 程 中 的 复制 、 粘 贴 、 删 除 ， 显 示 锁 、 用 户 连 接 信 息 ， 元 数据 信 
县 日 志 等 操作 ， 如 图 22-25 所 示 。 








E Disconnect 


show Locks... 


show User Connections.. 


Metadata Extensions.. 








Exit 





K] 22-24 PowerCenter Repository 图 22-25 PowerCenter Repository 


Manager Repository 5i ff. Manager Edit 5i f. 








3) View: 主要 进行 视图 的 显示 , 例如 状态 栏 、 导 航 条 、 输出 的 显示 或 隐藏 等 ,如 图 22-26 
所 示 。 

4) Security: 主要 进行 资源 库 的 安全 管理 ， 比 如 修改 当前 密码 、 管 理 用 户 和 授权 等 ， 如 
图 22-27 所 示 。 


| Change Current Password.. 
| 
| 


Manage Users and Priwvilegesz... 





图 22-26 PowerCenter Repository 图 22-27 PowerCenter Repository 


Manager View i£ FF. Manager Security i£ f. 





5) Analyze: 主要 实现 源 、 目 标 数 据 以 及 映射 等 的 依赖 关系 得 询 功 能 ， 如 图 22-28 Pr. 
6) Tools: 主要 完成 工具 的 切换 、 导 入 、 导 出 知识 库 等 操作 ， 如 图 22-29 所 示 。 








: TA ! 
Source/Target Dependencies Repository Manager 
Een Mapping Dependencies (2 Designer 
dd Shortcut Dependencies 四 Workflow Manager 


Q Workflow Monitor 


Export Registry... 
Import Registry... 
E Search by Target keyword... 


| Search All... 
| Properties... 
| 


Remove Repository... 


Queries... 


Na 


Üptions... 


Customize... 








图 22-28 PowerCenter Repository 
Manager Analyze 3i f. 
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图 22-29 PowerCenter Repository 


Manager Tools 5i FF. 


22.6.2 THF: 


有 关 PowerCenter Repository Manager 工具 栏 的 介绍 见 表 22-2. 


X 22-2 PowerCenter Repository Manager 工具 栏 


iz H 

连接 资源 库 服务 器 
ILES PE HAS A 
查看 依赖 

查看 映射 关系 
查看 快捷 依赖 关系 
DEBET Eri) 

属性 

底 端 依赖 视图 了 最 小 化 


Jm mw 3|*S Bi 


22.6.3 Uii 


ju — X 


PowerCenter Repository Manager 导航 如 图 22-30 所 示 。 


Repository Navigator 





&93 Repositories 
H- 8b Example 
— (f Deployment Groups 
H- (9 Test 
E f Sources 
"[» BONUS 
"V [COUNTRY 
"[ DEPT 
V» EMP 
V"  SALGRADE 
É Targets 
(^ Mappings 
六 Sessions 
六 workflows 
(2 Configurations 
© Rep 
B wf 


图 22-30 PowerCenter Repository Manager 导航 


22.6. 工作 区 


了 其 





PowerCenter Repository Manager 工作 区 如 图 22-31 所 示 。 








图 22-31 PowerCenter Repository Manager 工作 区 


EMP 
| Comments | Order | Business Name | Data Type | Precis... | scale | Key Type |Nullable — |Referenc.. 

$ EMPNO  - 1 - number(... 4 0 PRIMAR... no 

D ENAME 2 varchar2 10 0 NOT A KEY yes 

D JOB 3 varchar2 9 0 NOT A KEY yes 

D MGR 4 number(... 4 0 NOT A KEY yes 

D  HIREDATE - 3 date 19 0 NOT A KEY yes 

D SAL 6 number(.. 7 2 MOT A KEY yes 

D COMM 7 number(.. 7 2 MOT A KEY yes 

$ DEPTNO 8 number(... 2 0 FOREIGN... yes DEPTNO 






Reference 


DEPT 
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22.1  Workilow Manager 


Workflow Manager ( TEME HEA) 工具 主要 完成 任务 、 流 程 的 设计 管理 ， 基 于 时 间 、 
事件 的 合理 调度 等 内 容 ， 如 图 22-32 HMR. 











el - [al E 
c» Repository Edit view Tools Layout versioning Workflows Tasks Service Connections Window Help - [81 x| 
GAA | (Test - [Exanple] X 100% ~ Ag "4g 7/iloQ?t 
aeoaooeoecxex:oolgo [E ]| t m e | e (3 C3 i8 4o. glau | RI Cn 
Repository Navigator -x| : Vorkle 


; Task m » 
i iff Developer f Designer (ac MarS testi es 





S Repositories 
日 … B Example 


H t " I" wede- ee Ye cp M 
t [B  PowerCenter. Integration. Service dorcrtlow Desizner 


È- (9 Test 
p= (B Tasks 
日 - 的 Sessions 
|o LA 
P f worklets 
区 (B workflows 
P. =] Rep 
Can wf 














Starting wf_test1 
(PowerCenter Integration Service) Start workflow: Request acknowledged 
(PowerCenter Integration Service) Start workflow: INFO: Starting execution of workflow [wf testi] in folder [Test] last saved by user [Administrator]. 


-X 





Lo De Save AFetch Log À Validate ACopy A Integration Service lu g 


Red | mM | 


图 22-32 PowerCenter Workflow Manager 界面 


- 





Output Window 

















Workflow Manager 工具 主要 由 菜单 、 工 具 栏 、 导 航 、 工 作 区 和 输出 窗口 组 成 。 





22.7.1 x% 


1) Workflows: 主要 完成 工作 流 相 关 的 配置 功能 ， 比 如 创建 、 编 辑 、 删 除 、 局 动 等 ， 如 
图 22-33 所 示 。 

2) Tasks: 主要 完成 任务 的 创建 、 编 辑 、 打 开 、 连 接 、 局 动 、Session 设置 等 功能 ， 如 
图 22-34 所 示 。 

3) Service: 用 于 选择 在 Integration Service 上 运行 的 工作 流 ， 如 图 22-35 所 示 。 











注意 : 该 菜单 需要 将 所 有 的 文件 夹 目 录 (Folders) 关闭 才能 执行 。 若 要 关闭 某 个 文件 夹 
目录 (Folder )， 用 鼠标 右键 单 南 该 Folder， 在 弹出 的 快捷 菜单 中 选择 “Disconnect” 命 令 即 可 ， 
如 图 22-36 所 示 。 


240 





[wg | 
DEE Edit... p Edit... 
K Close Üpen Task 
elete p | 
Hp Link Task 


start Workflow ü l 
Link Seguential 
Recover Workflow Link Concurrent 


Uo Validate Start Workflow from Task 
[a] Schedulers... 


Start Task 


Recover Workflow from Task 


Compare... Recover Task 
Dependencies... i Validate 
Pi Wirard MES Session Configuration... 
图 22-33 PowerCenter Workflow 图 22-34 PowerCenter Workflow 
Manager Workflows i£ f. Manager Tasks zi f. 


| Àssign Integration Service... 





图 22-35 PowerCenter Workflow Manager Service 3i FF. 


4) Connections: 进行 关系 型 数据 库 、 队 列 、FTP、 应 用 程序 等 的 连接 操作 ， 如 图 22-37 
所 示 。 


&3 Repositories 
日 … B Example 
| — [Bj PowerCenter Integration Service 


z v Allow Docking 











El " Ë Hide x] Relational... 
: à Connect a Queue. .. 
p Disconnect e FTP... 
| 0 He ——M MÀ B licati 
be Rep Open *a Application... 
Ce wf Find Checkouts... KB Loader... 
Properties "y Replace... 
图 22-36 选择 “Disconnect” 命 令 图 22-37 PowerCenter Workflow 


Manager Connections 3i Hf 
22.7.2 工具 栏 
HX PowerCenter Workflow Manager 工具 栏 的 介绍 见 表 22-3. 


表 22-3 PowerCenter Workflow Manager 工具 栏 


按钮 jü 述 
£ 编辑 工作 流 或 可 重用 组 件 
2, 编辑 调度 
v 验证 完整 性 
© 调度 工作 流 
D+ 启动 Integration Service 


创建 、 编 辑 关 系 型 数据 库 连接 


241 





Qi 创建 、 编 辑 关 系 队 列 连接 
a. 创建 、 编 辑 FTP 连接 
Q 创建 、 编 辑 应 用 连接 
& QJ. ufo XE DE 
x PER 
-} 选择 在 Integration Service 上 运行 的 工作 流 
创建 一 个 会 话 
= 创建 一 个 命令 
创建 一 个 邮件 
= 创建 一 个 决议 
创建 一 个 任务 
创建 一 个 计时 器 
创建 一 个 控制 器 
创建 一 个 事件 等 待 
3 创建 一 个 事件 挂 起 
创建 一 个 可 重用 组 件 
建立 连接 线 
会 话 控制 操作 
日 创建 一 个 调度 


22.7.3 ”导航 


PowerCenter Workflow Manager 导航 如 图 22-38 所 示 。 


Repository Navigator -X 
E Repositories 
J- B Example 
: E FowerCenter_Integration_Service 


Tasks 


Sessions 
Ed s Testi 
vyorklets 
workflows 
"de 
m mb Start 
; s Testi 





图 22-38 PowerCenter Workflow Manager 导航 
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22714 工作 区 
PowerCenter Workflow Manager 工作 区 如 图 22-39 所 示 。 





:Task Worklet ETEA oS wf testi 
Inr ee n ^g Designer 26 ETEA | de wt tes z 





rr pler | e. [iz - 4 - cos 
dorpcrttlow Desisner 







s Testi 


sf 


图 22-39 PowerCenter Workflow Manager 工作 区 





€ Task Developer: 任务 开发 设计 窗口 。 
€ Worklet Designer: Worklet 开发 设计 窗口 。 
€ Workflow Designer: TEIN as. 
22.7.5 ”输出 窗口 
PowerCenter Workflow Manager 输出 窗口 如 图 22-40 所 示 。 






xllS5tarting wf testl 
|| (PowerCenter Integration Service) Start workflow: Request acknowledged 
(PowerCenter Integration Service) Start workflow: INFO: Starting execution of workflow [wf testl] in folder [Test] last saved by user [Administrator]. 


Output Window 
~ EE 


Ss D» Do Save AFeteh Log J Validate ACopy A Integration Service 


Ready o o SSO ]4Z 


图 22-40 PowerCenter Workflow Manager 输出 窗口 


22.8 Workilow Monitor 





Workflow Monitor CL TEZUaTiss) 是 针对 任务 、 工 作 流 程 运 行 时 的 一 个 全 方位 监控 和 跟 
蹊 的 管理 机 制 ， 如 图 22-41 所 示 。Workflow Monitor 用 于 记录 服务 运行 中 的 日 志 信 息 ， 包 括 
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Zh (Session). 日 志和 工作 流程 (Workflow) 日 志 ， 通 过 记录 、 收 集 、 分 析 这 些 日 志 信 息 ， 
可 以 对 整个 ETL 过 程 进行 全 面 的 掌控 。 










M Informatica PowerCenter Workflow Monitor E E - | 口 | x| 

Repository Edit View Tools Task Filters Help 

EEE 18 -mmi y y| y ji x -|*9 35 

& [4:00pm |5:00pm |B:00pm |7:00pm 8:00pm |9 
- Repositories 

E A-8 Example 

^ : -g PowerCenter Integration Service Disconnected 

3 

[e 00:00:18 Succeeded 

5 es 00:00:18 — |Sueceeded | | 

a ae 











Gantt Chart 


Properties - | - x| 








s Test1 [2007-5-27 16:52:58] 


Y Task Details 


Attribute Name Attribute Value a 








Instance Hame s_Testi 

Task Type Session 

Integration Service Hame PowerCenter Integration Service 
Node (s) nodeü1 20100729-1030 

Start Time 200T-5-2T 15:52:58 

End Time 200T-5-2T 15:53:16 


Recovery Time(s) 


Status Succeeded ps 
[oSource/Target Statistics 
la Partition Details 





, Ei 





B 一 Ey 


22-41 PowerCenter Workflow Monitor 界面 


2281 THF: 


和 任务 过 滤 右 设置 。 单 击 该 按钮 会 弹出 如 图 22-42 所 示 的 对 话 框 。 


Filter Tasks F3 


Show the Following tasks: 





Control Cancel 
C] Email Cael | 
[v] Event wait Help | 


Session 


口 Start 


Timer 


| ^ 


TT | Clear All 








22-42 PowerCenter Workflow Monitor “Filter Tasks ”对 话 框 


^: Integration Services 过 波 堪 设置 。 单 击 该 按钮 会 弹出 如 图 22-43 所 示 的 对 话 框 。 
* f£ Task View 视图 下 ， 增 加 显示 列 的 过 滤 条 件 。 

2 : Æ Task View 视图 下 ， 显 示 最 近 运 行 的 任务 。 

Ta 显示 属性 。 





244 


Filter Integration Services E 


Show the following 





PowerCenter Integration Service 


Select All 


中 


Clear All 





图 22-43 PowerCenter Workflow Monitor “Integration Services" XJ iE 


?a Won LTETR H s. 


^s. 显示 Session Hii. 
22.8.2 ”监控 区 


监控 区 分 为 甘 特 图 (Gantt Char) 和 任务 视图 (Task View) 两 种 显示 方式 。 

(OD 甘 特 图 

甘 特 图 直观 地 显示 了 各 个 工作 流 的 运行 情况 ， 便 于 用 户 通 过 有 效 的 调度 避 开 系统 运行 的 
王 贷 ， 为 系统 调 优 提供 了 依据 ， 如 图 22-44 所 示 。 


aen Has | 4:00pn 5:00pm |6:00pn [7:00pn |8:00pn | 
J-E Example 


目 PowerCenter Integration Service Disconnected 
= 的 Test 
4, w£ test 00:00:18 | Succeeded 


(co = Testl 00:00:18 Succeeded 

















如 











uI 
-— 






































& Rep 
8 wf 











:Q aQ -Q 1Q 








| Gantt Chart [ Task view | 
图 22-44 PowerCenter Workflow Monitor Gantt Chart 监控 区 


(2) 任务 视图 
任务 视图 显示 了 工作 流 运 行 的 开始 时 间 、 结 束 时 间 及 运行 状态 等 信息 ， 如 图 22-45 所 示 。 






































































































5 [B Repositories 
= Example =| PowerCenter Integratio... 
Ex 2- [E] PowerCenter. In E- Test 
x31 2 Test - 4 wf testl 
-| 42, wf testi = $ wf testl 2007-5-27 15:52:58 2007-5-27 15:53:18 Succee ded 

8 Rep - m (e s Testi 2007-5-27 15:52:58 2007-5-27 15:53:18 Succee ded 

= e wf testi 2007-5-27 15:28:24 2007-5-27 15:28:49 Succee ded 
S wf (e s Testi 2007-5-27 18:28:25 2007-5-27 15:28:49 Succee ded 


s 19 :© 10 


[ Gant chart | Chart | Task View | 





图 22-45 PowerCenter Workflow Monitor Task View 监控 区 
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22.8.3 ”属性 


PowerCenter Workflow Monitor 属性 如 图 22-46 所 示 。 


Properties ， LLLA ICE 


s Testi [2007-5-27 16:52:58] 
bA Task Details 





Get Session Loi 


Attribute Name a 
Instance Hame s Testi 

Task Type Session 

Integration Service Mame PowerCenter Integration Service 

Node (x) nodeO01 20100729-1030 

Start Time 2007-5-27 18:52:58 

End Time 200 3 en 53 

Recovery Time(s) 

Status Succee ded 


E | 
> sa | 
- CE 
> TAK———————— —— 


图 22-46 PowerCenter Workflow Monitor 属性 


€ Workflow Details: 显示 工作 流 的 详细 信息 ， 包 括 开 始 时 间 、 结 束 时 间 、 运 行 状 态 、 对 
络 末 数据 的 影 啊 等 信息 。 

€ Task Progress Details: 显示 任务 进程 的 详细 信息 。 

€ Session Statistics: 显示 会 话 的 统计 信息 ， 包 括 源 数据 、 目 标 数据 所 涉及 的 成 功 和 失败 
的 行 数 等 信息 。 
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1) Informatica 的 特点 : 强大 的 多 种 数据 类 型 访问 能 力 、 企 业 级 的 数据 集成 解决 方案 、 强 
大 的 ETL 抽取 -转换 -装载 〉 功 能 。 

2) Informatica 的 优势 : 在 合适 的 时 间 提 供 正 确 的 信息 ， 满 足 企 业 级 的 任务 关键 型 部 署 要 
求 ， 提 高 路 团队 的 工作 效率 并 加 强 路 职能 协作 ， 成 熟 的 市 场 、 丰 宇 的 经 验 以 及 众多 的 客户 和 群 。 

3) PowerCenter Designer Gxt ETEA), N ETL 〈 抽 取 - 和 转换- 装载) 过程 提供 源 数据 的 
定义 、 目 标 数据 的 定义 、Mapping 上 映 射 规则 的 定义 功能 ， 帮 助 设 计 人 员 及 开发 人 员 进 行 数据 
业务 的 设计 及 开发 工作 。 

4) Workflow Monitor 是 针对 任务 、 工 作 流 程 运行 时 的 一 个 全 方位 监控 和 跟踪 的 管理 机 
制 。Workflow Monitor 用 于 记录 服务 运行 中 的 日 志 人 信息， 包括 会 话 (Session) Hos LED 
fE (Workflow) 日 志 ， 通 过 记录 、 收 集 、 分 析 这 些 日 志 人 信息， 可 以 对 整个 ETL 过 程 进行 全 面 
DESA 

5) 通过 本 章 学 习 ,， 谈 者 了 解 了 Informatica PowerCenter 体系 4 大 工具 的 基本 使 用 与 作用 。 

€ PowerCenter Designer: ETL ixibs, WEIT ETL 的 开发 和 设计 工作 。 

€ Repository Manager: 资源 库 的 管理 工具 。 

€ Workflow Manager: 工作 流 管理 需 ， 包 括 创 建 、 运 行 等 。 

€ Workflow Monitor: 工作 流 监 控 费 ， 进 行 流程 的 监控 、 日 志 的 记录 等 。 
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"B23Z42* Cognos 工具 人 简介 


本 章 目 标 

Cognos 能 帮助 客户 提取 公司 的 业务 数据 ， 然 后 通过 后 台 计 算 分 析 ， 制 作出 可 以 为 公司 的 
管理 层 提供 决策 的 分 析 报 表 。 

Cognos 通过 报表 展示 的 数据 ， 是 基于 统一 的 元 数据 模型 。Cognos 强大 的 报表 制作 功能 6 
以 制作 出 满足 任何 需求 的 报表 ， 其 基于 B/S 的 使 用 方式 在 提供 方便 的 同时 ， 还 将 部 署 成 本 和 
管理 成 本 降 到 最 低 。Cognos 还 可 以 同 数 据 挖 据 工具 及 统计 分 析 工 具 搭 配 使 用 ， 以 增强 决策 分 
析 的 功能 。 

学 习 本 章 后 ， 您 将 掌握 : 
Cognos 的 历史 。 
€ Cognos 的 特点 。 
€ Cognos 的 安装 。 
€ Cognos | HJ Ui. 
o 
o 

















Cognos 架构 人 简介。 


Cognos 快速 入 门 。 


23.1 Cognos 介绍 


23.1.1 Cognos 的 历史 


1969 ^E, Cognos 公司 在 加 拿 大 首都 源太 华 正式 成 立 。 

WEZ] Cognos 公司 的 主要 业务 并 非 是 商业 智能 ， 而 是 像 大 多 数 科技 公司 一 样 ， 将 公 
司 业 务 定义 为 信息 咨询 与 管理 方向 。 几 年 后 ，Cognos 公司 的 高 屋 人 员 ， 才 将 公司 业务 定义 为 
商业 智能 方 同 ， 这 也 为 它 最 终 成 为 商业 智能 巨头 指明 了 正确 的 方 癌 。 

2008 年 ， 国 际 商业 机 器 公司 IBM 以 50 亿美 元 的 融 价 将 Cognos 购 入 旗下 。 从 此 ，Cognos 
fEl IBM 的 全 球 影响 力 ， 加 速 了 其 国际 化 市 场 的 友 展 。 


23.1.2. Cognos 的 特点 


(1) 方便 的 基于 B/S 架构 的 报表 开发 工具 

Cognos Connection 是 基于 B/S 架构 的 Cognos 门户 ,一 切 操作 都 可 以 在 浏览 贷 里 进行 , 极 
大 地 方便 了 设计 及 开 友 人 员 。 

(2) 强大 的 报表 制作 、 部 署 、 发 布 、 管 理 功能 

报表 的 制作 、 部 普 、 发 布 和 管理 功能 可 以 在 Connection 里 一 站 式 操作 。 用 户 可 以 使 用 
Cognos 报表 的 Web 页 面 的 发 布 功 能 、 强 大 的 部 车 能 力 及 负载 均衡 配置 ， 发 布 大 量 的 报表 。 报 
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表 系 统 的 使 用 者 可 以 快速 地 进入 到 公司 日 常 的 统计 分 析 中 ， 报 表 的 数据 可 以 为 公司 的 重大 决 
策 提供 重要 的 数据 参考 。 

(3) 快速 的 数据 访问 、 分 析 能 

Cognos 的 解决 方案 是 为 大 企业 、 集 团 公司 的 企业 决策 分 析 系 统 提供 迅速 的 、 准 确 的 处 理 
数据 的 能 力 和 决策 分 析 能 力 ， 从 而 在 变 约莫 测 的 市 场 中 抓 住 转瞬 即 逝 的 机 会 。 

(4) 强大 的 安全 性 保障 

Cognos 采用 集中 方式 、LDAP 的 安全 管理 机 制 。 用 户 可 以 在 任何 环境 中 使 用 Cognos 的 
安全 模型 。 该 模型 可 以 灵活 地 与 现 有 系统 的 安全 基础 框 染 集 成 或 者 整合 。 

(5) EZ BRI P BEI 

对 于 精通 业务 或 者 具有 财务 背景 的 用 户 来 说 ， 可 以 使 用 Report Studio 的 快速 创建 模式 来 
创建 一 些 简单 的 报表 , 还 可 以 使 用 Report Studio 扩展 的 动态 数据 功能 来 满足 业务 的 报表 需求 。 

对 于 业务 分 析 师 来 说 ， 可 以 使 用 Analysis Studio 提供 的 多 维 分 析 功 能 ， 从 多 个 角度 查看 
数据 信息 。 

对 于 专业 的 开发 人 员 来 说 ，Report Studio 的 增强 功能 将 满足 所 有 需求 。 


23.1.3 Cognos 的 现状 


2008 年 Cognos 公司 被 IBM 公司 收购 后 ，IBM 重新 整合 了 Cognos 的 业务 ， 于 2010 FHE 
tH f Cognos 10 版本。 在 本 书 中 ， 不 对 Cognos 10 进行 讲解 ， 只 针对 Cognos 8 的 安装 与 使 用 
3ETTTR] BAT 2B. 

HAT, Cognos 已 经 成 为 IBM 信息 管理 软件 部 门 的 一 个 事业 部 , 主要 负 员 商业 智能 以 及 绩 
效 管理 方面 的 业务 处 理 ， 成 为 IJBM“ 信 息 随 需 而 变 ” 战 略 的 重要 组 成 部 分 。 









































23.2 Cognos 工具 浏览 


1. Cognos Connection 

Cognos Connection 是 Cognos 集 设计 和 管理 于 一 体 的 报表 工具 。 

Cognos 安装 成 功 以 后 , 用 户 束 可 以 登录 a 到 Cognos Connection 界面 进行 报表 的 开 友 和 
ETE. 

2. Query Studio 

用 户 使 用 Query Studio HJ EA E xe XE; — refs] E. Bd. EH Framework Manager 发 布 
元 数据 模型 之 后 ，Query Studio 束 可 以 使 用 该 元 数据 进行 一 些 简 蛙 的 运算 ,以 实现 动态 的 业务 

3. Report Studio 

Report Studio 是 为 用 户 设计 开发 复杂 报表 的 专业 开 肥 工具。 其 编辑 和 展示 功能 要 比 Query 
Studio 强大 得 多 。 

4. Analysis Studio 

Analysis Studio 可 以 开发 比较 复杂 的 报表 。 其 分 析 功 能 要 强 于 Report Studio， 但 是 样式 稍 
微 欠 缺 。 用 户 在 使 用 Analysis Studio 的 过 程 中 ， 可 以 对 立方 体 模 型 中 的 数据 进行 切片 、 钻 取 
等 专业 操作 。 
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5. Event Studio 

Event Studio 可 以 对 事件 发 生 改 变 的 条 件 以 及 事件 的 变化 结果 进行 相关 设置 。 比 如 ， 在 每 
Ri 0 点 时 分 发 送 一 封 邮件 ， 每 月 星期 一 早上 6 点 目 动 生成 一 份 报表 等 。 

6. Framework Manager 

Framework Manager 是 元 数据 模型 的 制作 工具 。 在 制作 完 元 数据 模型 后 ，Framework 
Manager 还 将 这 些 模型 发 布 人 到 Cognos 的 设计 环境 中 ， 这 样 Query Studio 和 Report Studio 才能 
正常 地 设计 和 开发 报表 。 

7. Transformer 

用 户 通 过 Transformer 分 析 数 据 源 ， 然 后 建立 维度 和 上 度量， 最 后 生成 立方 体 模型 。 立 方 体 
模型 是 OLAP 分 析 数 据 的 基础 。 

8. PowerPlay 

PowerPlay 用 于 制作 基于 立方 体 数 据 模 型 的 多 维 分 析 报 表 。 

以 上 简单 介绍 了 Cognos 的 工具 ， 下 面 几 和 节 将 详细 介绍 这 些 工具 的 使 用 。 























29.9 Cognos Configuration 


Cognos Configuration 工具 如 图 23-1 所 示 。 


e Cognos Configuration 一 THY-CF63BO8936C 





File Edit View Actions Help 


Bibum-mi|ds|? | 











Explorer 
E} Local Configuration | ( Jue | 
&-[& Environment Deployment files location {deployment 
: [9 Cognos content database Data files location ,jdata 
a-ig Logging * Map files location ..Jmaps 
: File Temporary files location ..Jtemp 
Ga rg Cognos 8 service Encrypt temporary Files? False 
* 区 Cognos 8 *€ Format specification File location ..Jconfiguration/cogFormat. xml 
rg Portal Services Sort buffer size in MB 
日 -但 security Gateway Settings 
& Authentication à 
i Cognos Gateway namespace 
a Caj Cryptography Allow namespace override? False 
: Cognos 米 Dispatcher URIs for gateway http://localhost:9300/p2pdJservlet]dispatch/ext 
lif] Cognos Application Firewall ** Controller URI for gateway http:;//localhost:80/cognos8/controllerServer 
c-[S Data Access Dispatcher Settings 
Ej [rig Content Manager ** External dispatcher URI http://localhost:9300/p2pd/servlet/dispatch 
E cognos_oracle 米 Internal dispatcher URI http://localhost:9300/p2pdJservlet/ dispatch 
Notification Dispatcher password — — eeeeeeieeoeeiir 
日 - 固 Cognos Planning Other URI Settings 
ig Contributor Data Server 米 Dispatcher URI for external applications http://localhost:9300/p2pd/servlet/dispatch 
米 Content Manager URIs http://localhost:9300/p2pd/servlet 
Font Settings 
米 Physical Fonts locations Q ..JbinFonts; C WINDOWSIFONTS 
Physical fonts map «click the edit button> 
Fonts to embed (batch report service) «click the edit button 
Fonts to embed (report service) «click the edit buttonz- 


Specifies the URI to the gateway. 


The gateway must be located on the same computer as a Web server, If you are using ISAPI, change 'cognos.cgi' to 'cognosisapi.dll'. If you are using apache mod, 
change 'cognos.cgi' to 'mod  cognos.dll' on Windows, to 'mod  cognos.sl' on HP Ux PA-RISC, or to 'mod cognos.so' otherwise, Use the 'https' or 'http' protocol to 
select SSL or non-55L communication. The host name portion of the gateway URI must be changed from localhost to an IP address or a network host name. 











图 23-1 Cognos Configuration 工具 


Cognos Configuration 工具 的 功能 如 下 : 

e 初始 化 Cognos 组 件 ， 包 丘疹 口号、 本 地 URL、 文 件 大 小 、 日 六 存放 路 径 等 。 
€ 配置 Cognos 组 件 或 者 新 增 组 件 。 

e 在 本 地 计算 机 中 可 以 启动、 停止 、 重 局 Cognos 服务 。 
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29.4 Cognos Connection 


Cognos Connection 是 Cognos 8 产品 的 特色 之 一 ， 如 图 23-2 所 示 。 与 传统 报表 工具 不 同 ， 
Cognos Connection 提供 了 一 套 完 整 的 基于 B/S 架构 的 报表 展示 解决 方案 。 


Č Public Folders — Cognos Connection — Window 


HO AHO SEVU RERA IAO $8500 


s Internet Explorer 





Fa 
O GA y El http://localhost: 9300/p2pd/servlet/dispatch?b action-xts.run&m-portal/cc.xts&gohome- 


: : E » 
wp oU (Eraic Folders - Cognos Connection tet z - T Nm > gr IA ~ 





Cognos Connection 





[i4 Public Folders 


My Folders 


Public Folders 











Es 31 Cf Bf € ES) $ Ra FB X i0; 
Entries: | à © 








F e Internet "100€ v 


图 23-2 Cognos Connection 界面 








在 Cognos Connection HEE F, HIP'WDEDdRe. fri. DA RE, BEN BE GA 
据 包 等 功能 进行 设计 和 操作 。 

在 Cognos 报表 的 开发 过 程 中 ， 绝 大 多 数 工作 都 要 在 Cognos Connection 控制 台中 完成 ， 
包括 报表 的 设计 和 展示 ，Web 页 面 的 位 置 、URL 等 。 以 前 ， 开 发 人 员 与 使 用 人 员 的 显著 区 别 
在 于 : 开发 人 员 在 C/S 工具 中 做 系统 的 开发 ， 使 用 者 在 B/S 结构 的 系统 中 使 用 系统 。 现 在 ， 
开发 人 员 的 开发 工作 也 将 转移 到 B/S 架构 的 Cognos Connection 控制 台中 完成 。 

23.4.1 菜单 功能 


AXR Cognos Connection 3 FT] 4p 28 ILK 23-1. 











表 23-1 Cognos Connection 菜单 





说 i 
M 主题 查询 功能 
s 我 的 自 定义 区 域 设置 











加 载 工 作 区 ， 单 击 下 三 角 按钮 ， 在 弹出 的 下 拉 框 中 显示 了 Cognos Connection 整合 的 工具 


帮助 文档 


Launch 展开 的 工具 包括 : 

€ Query Studio: 简单 报表 制作 工具 。 

€ Analysis Studio: 报表 分 析 设 计 工 具 。 

€ Report Studio: 复杂 报表 制作 工具 。 

€ Event Studio: 事件 触发 工 上 其。 

€ Drill-through Definition: FERE X LE. 
€ Cognos Administration: Cognos 党 理工 具 。 


23.4.2 ”选项 卡 介 绍 


默认 情况 下 ，Cognos 分 Public Folders 和 My Folders 
两 个 选项 卡 ， 用 来 存放 Cognos 制作 好 的 报表 ， 如 图 23-3 on I: 











T Y N Ei mI -> > DEF ublic Folders / Folders 
所 示 。 当 然 ， 也 可 以 根据 项 目的 实际 需要 来 添加 或 者 删除 。 PL nene —— cnn 
一 些 选项 卡 来 方便 使 用 o Remove this tab 








Modify the seguence of tabs... 








23.4.3 工具 栏 的 使 用 
图 23-3 “Cognos Connection” Xm- 


AR "Cognos Connection” 工 具 栏 的 介绍 见 表 23-2. 


表 23-2 Cognos Connection 工具 栏 





jz 4 说 — 9j 
以 “列表 ”形式 显示 
以 “详细 信息 ”形式 显示 
m 新 建文 件 夹 
Ef 新 建 Job 
& 新 建 URL 连接 
ES 新 建 页 面 
EE 全 部 选择 
zl 全 部 取消 
à BIW) 
复制 
粘贴 
x 删除 
e 设置 选项 卡 属性 
dE 排序 


29.9 Query Studio 





Query Studio 用 于 创建 简单 的 查询 报表 ， 如 图 23-4 所 示 。 其 经 常 使 用 的 功能 如 下 : 
e cx. 
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e 创建 简单 报表 。 
e 完善 简单 报表 的 视觉 展示 功能 。 
e 使 用 过 滤 、 汇 总 、 聚 合 等 功能 来 处 理 分 析 业 务 数 据 。 


Menu [b D G Hà X &x:coco p Y 2 z Bi as sm Fh - lo ds c dm ES) RS Gm 
Insert Data $ Font w||Size 区 Av B I U Bv El ^ HH 

Edit Data 

Change Layout 
Run Report 


Manage File 




















Title 

















New 


P E7 |] 


Open... Select and insert items from the tree to fill in the report. 
EN Open in Report Studio You can also drag and drop items into the report. 


Save 
(gg Save As... 


Report Definition... 








Use Ctrl dick to select multiple items in the tree or report. 


Right-dick report item headings to access commonly-used actions. 


zl 
ISEHNESS | 


The report item that you selected does not support this action. Select a different report item or action. 








OK 











完成 Internet "M 100% ~ 


图 23-4 Cognos Query Studio 界面 
AXR Cognos Query Studio 3€. IJ4r 28 ILK 23-3. 


表 23-3 Cognos Query Studio 菜单 


xc 单 Tox 单 说 H 








Insert Data 动态 显示 模型 在 下 方 动态 显示 已 有 的 业务 模型 
Calculate... 计算 
Define Custom Groups... 自 定 义 客户 分 组 


mig Drill Down 向 下 钻 取 

mia Drill Up 向 上 钻 取 

ar] Go To... DEFE 

Rename Column Heading... 重 命名 列 头 

BY 

Paste 粘贴 

PX Delete 删除 

tft Undo 撤销 

(^M Redo 重 做 《与 撤销 相反 ) 


Edit Data 


Q 
& 
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"E" 子 菜 o5 说 9 
T 
Change Layout -一 
g Group 分 组 
HUM 
mH Expand Group 组 展开 
Run Report 
在 Excel 2000 中 以 单个 Sheet 格式 浏览 


s 


计算 (Calculate〉 在 报表 中 经 常会 用 到 ， 所 以 单独 讲解 计算 的 使 用 。 计 算 有 3 种 操作 方式 : 
1) SK (Arithmetic) 运算 : PATH. Jk. R, ER. AEQ CXGNGREJIO. AIE FO 
根 等 ， 见 表 23-4 和 图 23-5。 
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R 23-4 Cognos Query Studio Arithmetic 菜单 























Ro W Hio XX 

+ (sum) 为 选 定 的 报表 项 做 加 法 运算 

- (difference) 为 选 定 的 报表 项 做 减法 运算 

* (multiplication) 为 选 定 的 报表 项 做 乘法 运算 

/ (division) 为 选 定 的 报表 项 做 除法 运算 

^ (power) 为 选 定 的 报表 项 做 晕 次 方 〈 又 称 乘 方 ) 运算 

Absolute value 为 选 定 的 报表 项 做 求 绝 对 值 运 算 

Round 为 选 定 的 报表 项 做 四 舍 五 入 运算 

Round down 为 选 定 的 报表 项 做 取 整 运算 

Square Root 为 选 定 的 报表 项 做 平方 根 运算 
ea | 
peer. — B seb 
pese y 
"^ — —H MUR. 


me: 
© Use the default name 


O EB (数量 ) 





Insert Cancel 
图 23-5 Cognos Query Studio Arithmetic 操作 


2) 百分比 CPercentage) 计算 : 包括 求 百 分 比 〈%)、 所 占 总 数 的 百分比 (% of total)、 问 
脚注 添加 百分比 C% of footer), 2:801 GHKK) (% difference (growth)), 见 表 23-5 和 图 23-6. 





表 23-5 Cognos Query Studio Percentage 菜单 


HR 作 fü — XX 
% 计算 选 定 项 目的 值 ， 以 占 其 他 项 目的 百分比 表示 
% of total 计算 选 定 项 目的 值 ， 以 占 合计 的 百分比 表示 
% of footer 计算 选 定 项 目的 值 ， 以 占 脚注 的 百分比 表示 
% difference Cgrowth) 计算 两 个 项 目 之 间 的 差额 (以 百分比 表示 ) 


Ee 








New calculated report items appear after the last selected item. You can safely delete report items that were used to create calculations. 
Operation type: Expression: 
| Percentage Y Percentage of total (数量 ) 
Operation: 
| % of total vi 


Report item: l 
| 数量 v | New item name: 
© Use the default name 


eB Gi 











Insert Cancel 


图 23-6 Cognos Query Studio Percentage 操作 


3) Hr (Analytic) 运算 : 包括 平均 值 (Average)、 w A18 (Maximum), 最 小 值 (Minimum)、 
排序 (Rank)、 所 占 总 数 的 百分比 (% oftotal)、 百 分 数 (Percentile), UAM% (Quartile), 
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分 位 数 CQuantile) 等 ， 见 表 23-6 和 图 23-7. 


表 23-6 Cognos Query Studio Analytic 菜单 








Ro dE Hio XN 
Average 为 选 定 的 报表 项 做 平均 值 运算 
Maximum 为 选 定 的 报表 项 求 最 大 值 运算 
Minimum 为 选 定 的 报表 项 求 最 小 值 运算 
Rank 返回 选 定 的 报表 项 目 中 每 个 值 的 排名 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 排名 





计算 选 定 的 报表 项 目的 每 个 值 占 总 额 的 百分比 。 对 于 已 分 组 的 报表 , 将 返回 每 个 值 毛 占 分 组 总 额 或 总 计 的 
百分比 


返回 值 的 百分数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 百分数 
返回 值 的 四 分 位 数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 四 分 位 数 
返回 值 的 分 位 数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 分 组 或 所 有 值 中 每 个 值 的 分 位 数 


2% of total 








Percentile 
Quartile 
Quantile 


New calculated report items appea can safely delete report items t te cal 


Expression: 
Average (数量 , 0) 


Operation type: 
Analytic v 








Operation: 
Average ~i 











Selected report items: 


数量 New item name: 
($) Use the default name 


Oo 

















Number: 





Insert Cancel 


图 23-7 Cognos Query Studio Analytic 操作 
L (Summarize) 汇集 了 多 种 函数 ， 见 表 23-7 和 图 23-8. 


表 23-7 Cognos Query Studio Summarize 菜单 











PR 数 fü 述 
针对 一 系列 值 的 求 和 
Total 注释 :“ 求 和 ”可 以 返回 的 最 大 值 是 列 数据 类 型 的 最 大 值 。 该 函数 将 反复 执行 “ 求 和 ”函数 。 先 从 
第 一 行 中 获取 值 ， 再 将 第 二 行 的 值 添加 到 函数 ， 然 后 是 第 三 行 ， 依 次 类 推 。 如 果 任 意 点 处 的 中 间 值 超 
出 该 数据 类 型 的 最 大 值 ， 那 么 数据 源 将 返回 错误 
Count 返回 记录 的 总 数 
Maximum 返回 最 大 值 。 当 申请 的 类 型 为 日 期 或 者 时 间 数 据 时 ， 返 回 最 近 的 值 
Minimum 返回 最 小 值 。 当 申请 的 类 型 为 日 期 或 者 时 间 数 据 时 ， 返 回 最 早 的 值 
Average 返回 一 系列 值 的 平均 值 
Ci 指定 在 用 于 填充 列 的 表达 式 内 定义 汇总 
注释 : 一 般 认 为 表达 式 本 有 身 是 一 个 聚合 图 数 ， 并 且 不 需要 修改 就 能 提供 汇总 值 
Automatic 基于 数据 类 型 汇总 值 
Median 返回 选 定数 据 项 的 中 间 值 


Standard Deviation 


Count distinct 


None 


3 [ne a BC PE E 2 
返回 唯一 的 非 空 记录 的 总 数 
删除 脚注 。 只 适用 于 脚注 值 ， 不 适用 于 明细 


2 9 


Set up totals or other summaries. Advanced 


Summary for footers: 


Calculated v 





OK Cancel 





23-8 Cognos Query Studio Summarize 操作 


23.6 Analysis Studio 介绍 


Analysis Studio 是 Cognos 8 的 OLAP 分 析 解 决 方案 工具 。 它 通过 使 用 同 下 钻 取 CDrilD. 
切片 〈Slice) 与 旋转 (Dice) 等 多 维 分 析 功 能 ， 以 高 效率 访问 、 人 快速 响应 的 优势 进行 多 维 分 
析 工 作 ， 如 图 23-9 所 示 。 


[4 


THO 编辑 于) EAU KEKA IAT H) 


AP —— — 一 orm 
eJ ED 了 |Ø http://localhost: 9300/p2pd/explore/ explore. htm vi | 好 X 也 | 


IEEE 

















» d BB -En Folde... [e Te x EMSC.. |f cope ym Æ HERA... Wer ye | e x = y IET z GIRO Nf 





File Edit View Settings Run Help 


D Gig xowaQq|r-FEi-|y-zE-d20-|E3 Z- E | &- M) 


























<| E55 产品 
[figsales2 dita] | [REN ~ sd 
pe 
Sh 产品 名 称 -| 
时 ,地 区 名 称 2009 | 26 77A 116 182 | 1823 2918 
[E] Measures 1146 462 | 558 | 652 88 | 1080 261 450 4697 
956 | 354 | 452 820 2582 





统计 日 1146 488 558 2379 442 1532 377 632 2643 10197 





s p 
—À € 
完成 | @ Internet 9 1008 ~ "E 
—-— CHE) MÀ 


23-9 Cognos Analysis Studio 界面 


Analysis Studio 提供 了 交互 式 的 开发 环境 分 析 业 务 数据 , 帮助 用 户 以 最 快 的 速度 找到 解决 
问题 的 方法 。 通 过 Analysis Studio 可 以 做 到 : 

e 查找 并 定位 用 户 所 关注 的 业务 中 的 重要 信息 。 

e 了 解 业 务 的 走势 及 反常 的 现象 。 

e 通过 对 比 数据 发 现实 际 数值 与 预测 数值 的 闫 距 。 
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e 绩效 评估 (通过 最 佳 和 最 差 结果 来 衡量 )。 
e 通过 一 系列 的 计算 来 展示 管理 人 员 需 要 的 重要 信息 。 


e Jz 





o 


23.6.1 Analysis Studio 的 组 成 


Analysis Studio 由 以 下 几 部 分 组 成 。 

1. 源 目录 结构 树 

源 目录 树 状 结构 显示 了 纬度 、 分 类 、 层 、 上 度量 等 数据 源 信 息 。 

2. 分 析 项 目的 选项 卡 

分 析 项 目的 选项 卡 包含 了 所 创建 项 目的 列表 信息 。 

3. 信息 窗口 

言 居 窗 口 显示 了 名 称 、 类 型 、 级 别 、 肾 合 、 属 性 等 相关 信息 。 

4. 浏览 区 

浏览 区 显示 了 上 所 有 应 用 的 过 滤器 和 排序 信息 。 

5. 工作 区 

工作 区 用 来 创建 业务 报表 的 展示 信息 。 可 以 在 该 工作 区 中 创建 符合 客户 需求 的 一 系列 与 
业务 紧密 相连 的 报表 ， 例 如 柱 形 匈 、 交 叉 匈 、 仪 表盘 等 。 

6. 属性 窗口 

属性 窗口 用 来 显示 对 象 的 所 有 相关 属性 。 可 以 在 属性 窗口 中 针对 茶 个 对 象 进行 详 细 的 配 
置 更 改 ， 以 达到 用 户 最 高 的 请 意 度 。 


23.6.2 ”菜单 功能 


在 Query Studio 有 亲 早 中 介绍 过 的 内 容 本 节 不 再 袭 述 。 本 节 只 介绍 增 量 亲 单 见 表 23-8。 如 
有 需要 ， 请 谈 者 参考 23.5 市。 















































表 23-8 Cognos Analysis Studio 菜单 


New 新 建 
Edit 
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CHE) 











Insertion Options 插入 选项 
Show Welcome Dialog 显示 欢迎 对 话 框 
Get Data Later 后 来 获取 数据 





菜单 T d di H 
JUR 
Ek 
DUNAR 
AUREHORTI GÐ 
View 选择 图 表 类 型 EAR 
ERN OERO 
EREIN CAWO 
ERRIN OHRID 
TERN OUO 
ERER GARR 
EEREN UNER 
| TETITTEIUTST 
m UAR 
CEU 
CETT. 
nt 
设置 可 视 项 的 显示 数据 数 
KN 
BHi 
m | 
g- IT NENNEN 
Ee 


23.7 Report Studio 介绍 








Report Studio 是 Cognos 8 的 专业 报表 制作 工具 ， 以 Framework 提供 的 发 布 包 为 基础 进行 
报表 的 开发 ， 如 图 23-10 所 示 。 使 用 Report Studio 可 以 制作 出 任何 复杂 的 报表 ， 比 如 财务 报 
表 、 销 售 报表 、 友 票 报表 等 。 


File Edit View Structure Table Data Run Tools Help 


























D GEHixtuiexi ie] kd P -| 























E 
ab| Text Item a 
173 Block á 

9 
H Table S 
ab) Field Set 


Calculated Member 











Calculated Measure 
FA intersection (Tuple) 
ES Query Calculation 











Ea Layout Calculation 
[£) Image HAs ies: 

















Crosstab Space Category 0-838): 
[ ] Crosstab Space (with fact cells) T : 
Lu zl 
[4] 
© Conditional el 
Conditional Styles 
Style Variable 
- Box 
Border 了 | 

















图 23-10 Cognos Report Studio 界面 
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Report Studio 提供 了 两 种 创建 模式 。 

1. 专业 创建 模式 

专业 创建 模式 为 用 户 提 供 了 最 大 功能 的 访问 权限 。 用 户 可 以 使 用 多 种 数据 源 ， 进 行 任何 
复杂 的 报表 制作 ， 比 如 地 图 、 多 表 头 报表 等 。 在 该 模式 中 ， 不 能 租 看 动态 数据 信息 。 

2. 快速 创建 模式 

快速 创建 模式 为 用 户 提供 了 简单 而 集中 的 Report Studio 界面 。 即 使 开发 人 员 不 太 了 解 业 
务 ， 也 可 以 创建 传统 的 财务 和 管理 报表 。 该 模式 的 权限 仅 限 于 访问 按 维度 建 模 的 数据 和 使 用 
面 问 成 员 的 数据 树 结 构 。 

这 两 种 模式 在 实际 开发 中 可 以 进行 切换 ,六 提 是 用 PITT 


c WW SALES 














户 有 足够 的 权限 访问 这 两 种 模式 。 一 般 情 况 下 ， 使 用 快 Wn 
速 创建 模式 创建 报表 , 然后 切换 到 专业 创建 模式 进行 更 te 
多 信息 的 设置 。 如 地 区 名 称 
即 数量 
T ETME] 


23.7.1 Report Studio 的 组 成 


Report Studio 工作 区 由 以 下 儿 个 部 分 组 成 。 
1) Insertable Objects (可 插入 对 和 象 工作 区 ) 包括 以 























TS E S S T uw 
Source: 业务 源 信息 显示 ， 如 图 23-11 所 示 。 | 23-11 Cognos Report Studio Insertable 
Data tems: 显示 工作 区 中 的 查询 主题 ,如 图 23-12 Objects Source 工作 区 
Biz. 
Toolbox: 页 面 布 局 按钮 及 对 象 ， 如 图 23-13 Bran. 
日 闻 Query: | [ab] Text Item zi 
aem £71 Block 
T 地 区 名 称 Im 
"Ser ERR HH Table 
[ab] Field Set 





Ba Calculated Member 
Fal Calculated Measure 


Intersection (Tuple) 






































| E Query Calculation =| 
图 23-12 Cognos Report Studio Insertable | 23-13 Cognos Report Studio Insertable 
Objects Data Items 工作 区 Objects Toolbox 工作 区 
HJ IEA XTZ VL HH] ILK 23-9. 
R 23-9 可 插入 对 象 说 明 
可 插入 对 象 Hoo x 
Text Item 报表 中 的 一 个 条 目 。 内 容 可 以 是 静态 的 文字 ， 也 可 以 来 自 一 个 碍 询 条 目 或 报表 的 表达 式 
Block 添加 空 块 ， 该 块 是 可 以 插入 其 他 对 象 的 容器 。 这 对 控制 对 象 的 显示 位 置 非常 有 用 
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可 插入 对 象 
Block 


Table 
Field Set 
Calculated Member 
Calculated Measure 
Intersection( Tuple) 
Query Calculation 


Layout Calculation 


Image 


Crosstab Space 


Crosstab Space(with fact 


cells) 


List 
Crosstab 
Chart 
Map 
Repeater Table 
Repeater 
Singleton 


Conditional Blocks 


HTML Item 


Rich Text Item 


Hyperlink 
Hyperlink Button 
Date 


Time 


As of Time Expression 


Page Number 


Row Number 


Layout Component 
Reference 


Metric Studio Diagram 
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jü 述 
提示 : 用 户 可 以 使 用 块 在 对 象 之 间 添 加 空格 。 但 是 ， 空 块 不 会 显示 出 来 ， 必 须 插 入 对 和 象 或 指定 局 





度 和 宽度 








深 加 表 格 ， 该 表格 是 可 以 插入 其 他 对 象 的 容器 。 这 对 控制 对 象 的 显示 位 置 非常 有 用 

深 加 具 有 标题 的 空 块 。 这 与 “ 块 ” 对 象 类 似 ， 但 是 具有 标题 

深 加 已 计算 的 成 员 

添加 已 计算 的 度量 

添加 交集 〈 数 组 ) 

添加 已 计算 的 列 

在 包含 运行 时 信息 《例如 当前 日 期 、 当 前 时 间 和 用 户 名 ) 的 布局 中 添加 计算 

添加 图 像 对 象 

一 个 指 加 网 像 文件 的 链接 。 该 链接 可 以 是 一 个 静态 值 ， 也 可 以 来 目 一 个 报表 表达 陈 或 得 询 项 目 。 
使 用 图 像 的 对 象 来 定义 链接 的 URL 源 属 性 

在 交叉 表 边 缘 上 插入 空 单 元 格 。 人 允许 在 边缘 上 插入 非 数据 单元 格 。 报 表 运 行 时 会 显示 边缘 的 空 单 
元 格 

如 果 交 叉 表 边 缘 没有 有 用 的 数据 ， 而 用 户 希望 改 为 在 单元 格 中 显示 空白 ， 则 插入 该 对 多 

在 交叉 表 边 缘 上 插入 空 单元 格 。 允 许 在 边缘 上 插入 非 数 据 单 元 格 。 在 添加 度量 或 指定 默认 度量 后 ， 
将 在 边缘 上 生成 资料 单元 格 

如 采 已 嵌 套 交叉 表 空 间 ， 则 资料 单元 格 的 范围 为 位 于 空间 前 的 级 别 上 的 项 目的 范围 

如 果 未 奶 套 区 叉 表 空间 ， 并 且 其 下 不 存在 任何 符 套 项 目 ， 则 资料 单元 格 的 范围 为 默认 度量 

一 个 布局 对 象 ， 目 的 是 加 入 下 一 个 列表 

一 个 交叉 表格 布局 对 象 ， 用 于 提供 一 个 查询 、 汇 总 数据 ， 然 后 排列 在 一 个 二 维 网 格 中 

添加 一 个 岁 表 对 象 


洪 加 一 个 使 用 地 图 展示 数据 的 图 表 对 象 


添加 重复 恬 表 格 对 象 
查询 表 中 的 数据 呈现 


AS JI ERE d] 
插入 单一 数据 项 对 象 
添加 可 用 于 条 件 格式 化 的 空 块 对 象 


添加 可 以 插入 HTML. 代码 的 容器 。HTML 项 目 可 以 是 浏览 器 将 执行 的 任意 项 目 ， 包 括 链接 、 图 
像 、 多 媒体 、 工 具 提 示 或 JavaScript。 仅 当 以 HTML 格式 运行 报表 时 才 显 示 HTML 项 目 
ik: HTML 项 目 中 不 能 包括 <form> 标签 


插入 用 于 在 布局 中 显示 HTML 的 对 象 。 访 对象 与 “HTML 项目” 类似， 但 是 宇文 本 项 目 也 可 以 
在 PDF 输出 中 显示 。 将 在 数据 源 中 定义 的 注解 添加 到 报表 时 ， 使 用 宇文 本 项 目 非 常 有 用 
注 : 宇文 本 项 目 仅 文 持 受 限 的 格式 正确 的 XHTML 集合 


添加 超级 链接 以 便 用 户 跳 至 其 他 位 置 “ 例 如 网 站 ) 

以 按钮 的 形式 添加 超级 链接 

添加 报表 运行 的 日 期 对 象 

淇 加 报表 运行 的 时 间 对 象 

添加 一 个 可 以 产生 日 期 -时 间 值 的 表达 式 

该 表达 式 产 生 一 个 日 期 -时 间 值 。 这 个 表达 式 可 以 用 来 显示 一 个 特定 时 期 内 ， 由 创建 的 表达 式 定 
义 的 报表 结果 

插入 可 以 目 定 义 的 页 码 对 象 

报表 运行 时 ， 每 行 数据 返回 的 编写 对 象 

注 : 可 以 仪 将 行 号 添加 到 列表 和 重复 器 

将 引用 添加 到 其 他 对 象 。 当 重复 使 用 对 象 时 非常 有 用 


添加 Metric Studio 历史 记录 图 表 作 为 图 像 








































































































可 插入 对 象 JH — X 
Table of Contents 创建 在 报表 输出 中 生成 的 目录 对 象 
Table of Contents Entry 添加 目录 标记 
Bookmark 插入 书签 ， 以 便 用 户 从 报表 的 一 个 部 分 移 至 另 一 部 分 
Text Box Prompt 一 个 控制 右 ， 人 允许 用 户 在 值 中 定义 类 型 
Value Prompt 允许 用 户 从 列表 中 选择 一 个 或 者 多 个 值 的 提示 控制 
Sn mu m 按照 需要 的 搜索 规则 确定 一 个 选择 范围 。 用 户 不 能 使 用 此 SAP BW 的 数据 源 提示 
Date & Time Prompt 一 个 控制 右 ， 用 户 可 以 选择 一 个 日 期 和 时 间 值 
Date Prompt 一 个 控制 器 ， 用 户 可 以 选择 一 个 日 期 值 
Time Prompt 一 个 高 级 的 控制 ， 人 允许 用 户 选择 一 个 时 间 值 
Interval Prompt 一 个 高 级 的 控制 ， 用 于 间隔 时 间 的 提示 
Tree Prompt 个 控制 器 ， 显 示 分 层 信息 ， 并 允许 选择 一 个 或 多 个 成 员 
Generated Prompt Aih EAA a ANTI A 
Prompt Button 使 用 预先 定 义 的 按钮 提示 页面 。 它 的 用 法 的 变化 ， 根 据 其 类 型 属性 ， 可 以 设置 为 取消 、 上 一 步 、 
下 一 步 、 完 成 或 重新 提示 





2) Page Explorer (H HRI E SESS) 工作 区 如 图 23-14 所 示 。 
3) Query Explorer (AWR E 84s) 工作 区 如 图 23-15 所 示 。 











Page Explorer x 
3 C3 Report Pages 
3 (Sg Queries 
[i] Prompt Pages m 
E Classes lll] Querv2 








图 23-14 Cognos Report Studio Page Explorer 工作 区 — [| 23-15 Cognos Report Studio Query Explorer 工作 区 








选择 东 个 得 询 主题 ， 系 统 会 目 动 切换 工作 区 ， 如 网 23-16 所 示 。 





sz] Detail Filters 





Summary Filters 





图 23-16 系统 自动 切换 工作 区 
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4) Condition Explorer (AFAJ E Ear) WK] 23-17 PZR- 


Condition Explorer x 





El Variables 





(No variable) 


图 23-17 Cognos Report Studio Condition Explorer 工作 区 


23.7.2 ”菜单 功能 
Report Studio 是 专业 的 报表 开发 工具 。 有 关 Cognos Report Studio 3€] 4128 ILE 23-10. 


表 23-10 Cognos Report Studio 菜单 


x 单 T sk 单 说 明 
se 
Cut BYW) 
Edit 
fi 
Professional 和 Express 两 种 模式 
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View 


Structure 


Table 


Data 


Tools 


Prompt Pages 

Queries 

Variables 

Classes 

Page Design 

Page Structure 

Toolbars 

Panes 

Visual Aids 

Group/UnGroup 

Swap Rows and Columns 

Set Page Break 

Set Page Break Using Master/Detail 
Section 

Section Using Master/Detail 
Headers & Footers 

Pivot List to CrossTab 
Covert List to Repeater Table 
Convert Chart... 

Insert Table of Contents Entry 
Lock Page Objects 

Create CrossTab Nodes 
Insert 

Delete 

Select 

Merge Cells 

Split Cell 

Apply Table Styles... 
Calculate 


Filters... 


Sort 

Aggregate 

Insert Children 

Master Detail Ralationships 
Drill Behavior 

Default Data Formats... 
Validate Report 

Validate Options... 


Auto Correct... 


(5E) 
说 — 8j 





显示 提示 页 面 
显示 人 查询 主题 

显示 变量 

显示 类 

页 面 设计 

页 面 结构 

显示 工具 栏 

显示 面板 

可 视 区 域 设 置 
分 组 /取消 分 组 
行列 互 换 
设置 页 面 断 点 

使 用 主 / 明 细 设 置 页 面 断 点 
分 段 

使 用 主 /明细 分 段 
在 分 组 时 插入 表 头 / 表 尾 
将 列表 转换 成 交叉 表 
将 列表 转换 成 Repeater 表 
转换 成 图 表 

插入 目录 项 
锁定 页 面 对 象 
创建 交叉 表 节 点 
插入 

删除 

选择 

合并 单元 格 
拆 分 单元 格 

应 用 表格 样式 

计算 

过 滤 

排序 


聚合 

插入 子 集 

主要 明细 关系 

钻 取 行为 

默认 数据 格式 

验证 报表 

验证 选项 

目 动 校 验 正确 性 
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Xo T X 4 yi — Hj 
Show Generated SQL/MDX 显示 生成 的 SQL/MDX 
Show Specification 显示 明细 
Show Specification (Selection) 显示 (可 供 选 择 的 ) 明细 
Open Report form Clipboard 从 剪贴 板 中 打开 报表 
Tools Copy Report to Clipboard 复制 报表 到 剪贴 板 


Manage Conditional Styles... 条 件 样式 管理 
Layout Component Cache... 布局 组 件 缓存 
Build Prompt Page 创建 提示 页 
Options 选项 


23.8 Event Studio 介绍 











当 业 务 中 的 某 个 事件 发 生 时 ， 需 要 触发 一 个 事件 来 啊 应 该 事件 ， 这 时 候 丈 需要 用 Event 





Studio CILE] 23-18) 通知 事件 中 的 决策 者 ， 以 便 系统 使 用 者 快速 准确 地 做 出 决策 。 


File Edit View Insert Actions Help 





| Insertable Objects | Specify the condition that defines an event by selecting or dragging insertable objects, or by ty 
> s each task tha ts the task execution ri 





O es e 7 e ping items, functions, parameters, and values in the event 
f$) Functions box. When the agent detects this event, it performs each task that meets the ules. 
+) Operators Em 
dao Detail Summary ES E Ee 
由 -多 | Summaries 
Use the Detail tab to create an expression that is applied to the values in the data source. 
E- C Member Summaries 
Expression: 
3j- 3 Constant P 


=b |Define an event by selecting or dragging insertable objects, and/or typing items, functions, parameters, and values required. 














Informa tion: 
[finance].[monthly].[code] = 'A' and [finance].[monthly].[amount] > ?parameter? 
Use items, functi s, and values to build an expression. 
Tips Error 
a m T Q 
完成 Internet A 100€ 7 





图 23-18 Cognos Event Studio 界面 


用 户 可 通过 创建 监控 代理 的 方式 来 检测 业务 事件 的 发 生 。 当 代理 检测 到 事件 发生 时 ， 将 
触 用 一 系列 动作 ， 比 如 发 送 短信 提示 给 负责 人 、 将 信息 记录 发 送 邮 件 、 运 行 共 个 事先 开发 好 
的 报表 等 。 


23.8.1 Event 介绍 


在 处 理事 件 的 时 候 ， 首 先 需 要 为 该 事件 添加 一 个 Event 的 触发 条 件 ， 比 如 转账 金 笑 大 于 
10 万 元 人 民 币 、 单 笔 区 易 金额 超过 100 万 元 人 民 币 、 当 天 在 线 人 数 累 计 达 30 万 人 次 等 。 本 例 
中 ， 将 销售 案例 中 的 “数量 ”>100 作为 事件 触发 条 件 湛 加 到 表达 式 中 ， 如 图 23-19 所 示 。 
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只 有 添加 了 该 事件 的 触发 条 件 ， 系 统 才 会 执行 下 面 介 绍 的 几 种 触发 类 型 的 任务 。 





New 一 Event Studio 一 Windows Internet Explorer 


文件 区) 编辑 区 ) ”查看 名 KERA IA $E 








« 


E lej] 





mi 





*5X| 











Go v || http://localhost:9300/p2pd/servlet/di spatch& 











Xt 安 pop ewe rars Ene - fes x Eru- maly EMR S mmm... | | Io E) c oomao-QIAO-" 











File Edit View Insert Actions Help 之 
DBHu!|xtsas&xoo!|Zz»-|£8-H 5 
Event: Tasks: A^ 


| ? 
] | 


- Specify an event condition 








Specify the condition that defines an event by selecting or dragging insertable objects, or by typing items, functions, parameters, and values in the event box. When the agent detects this event, it 
performs each task that meets the task execution rules. 


Detail Summary a 


Use the Detail tab to create an expression that is applied to the values in the data source. 








Expression: 


=> | [数量 ]>100 











Information: 
[finance].[monthly].[code] = 'A' and [finance].[monthly].[amount] > ?parameter? 
Use items, functions, parameters, and values to build an expression. 





M 
向 Jill | iB 


ae | 
23-19 Cognos Event Studio Event 触发 条 件 举例 


23.8.2 Task 介绍 


1]. Email 

顾名思义 ，Email bzEAXESBHBPPIESOS. HZR, RRS HAJRI Email £1 H 
定义 的 用 户 ， 同 时 抄 送 一 份 该 邮件 给 抄 送 者 。 例 如 ， 发 送 邮 件 给 chinalgf@126.com， 同 时 抄 
送 一 份 给 wangfei5673@sina.com， 如 图 23-20 所 示 。 





New 一 Event Studio 一 Findows Internet Explorer 


HEO 9:80) SEU KERA) IAT) #8 Q0 











m 


E P 














Go v | http: //localhost:9300/p2pd/servlet/dispatchit vx 
宽 4f [E |- ny ries 一 [fer -mw x [e ay |gwecsm Gsm- | | A-D- d&-imREO-QIRO- M 




















File Edit View Insert Actions Help — 
DHYG|zsxoo!lE»-|B-EBÓ 


Event: Tasks: 





> 


v 











kt sd d [4 
[数量 ]>100 | new message "T 


[=] Specify the email to send 


Specify the recipients and contents of the email. To add recipients, click Select the recipients or type the email addresses separated by semi-colons. To include an HTML report as the message body, 
leave the Body box empty and select the report as the only attachment. 



































To: 
= |chinalgfG126.com 
Cc: 
wangfei5673(sina.com 
Select the recipients... Show Bcc 
Subject: 
mb | 销售 报告 
Body: Chanae to plain text» B Z U E EZE E EEE BG 
= Hello, ^ 
产品 销售 区 域 报告 测试 3 
End. v 











Internet 


23-20 Cognos Event Studio Tasks 触发 条 件 举例 
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2. News Item 介绍 
有 时 ， 当 一 个 事件 发 生 时 ， 需 要 在 Web 页 面 发 布 一 些 消息 或 者 新 闻 。 这 时 ， 束 需要 创建 
一 个 News Item 来 满足 要 求 ， 如 图 23-21 所 示 。 


New — Event Studio — Windows Internet Explorer 


XE) dim) SEV oko) IAT) $BbOD 











Go Y E) http: //localhost:9300/p2pd/servlet/dispatch& v | 好 | X| BE P - 











* d 88- Em Folders ... [Æ ev -mr x [fixe - 17... | CER "m | Æ MEA - m | 一 m z H € v [sy Süd (D - QIRQ -> 















































File Edit View Insert Actions Help A 
DbBu!xtsasi&xoo!|£AZ2»-|8- E E 
Event: Tasks: "^| 
I moe E 
-|| B00 | WERS i 
[E] Specify the news item to publish 
Specify the headline text, link to entry, and the location of the news item. You can also specify a screen tip and a text. The headline, screen tip, and text can have dynamic content by using items fron 
the agent list. The agent will publish this news item when it detects events and determines that the task execution rules are met. 
Headline: 
ml iie v ^S 
£ = 
Screen tip: 
=æ | 销售 A 
v 
Text: 
= | 产品 销售 区 域 2 测试 文本 .…. ^ 
v 
Link to: 
Select to view this agent's event list, an entry or a URL address when clicking the news item headline. News list location: 
© Event List None 
Select a location... 
.. Entry: 的 
< Ji | ia v| 





IIT I T T mem dr Q Internet Rios ~ 
23-21 Cognos Event Studio New Item 创建 


3. Report 介绍 
创建 Report 如 图 23-22 所 示 。 


New — Event Studio —- Windows Internet Explorer 


EFO dim) SEVU KERA IAT)  $BbOD 











Go Y E) http: //localhost:9300/p2pd/servlet/dispatch& v | 人 好 | X| BE p - 











* L1 &- ew Folde... [e S X [8 sesion. [e mE | ics... Æ IKEM... m z Md a z nmt b QIROQ zA : 











File Edit View Insert Actions Help 
DBHS|xgxoowo!|£A»-|8- EB E 
< 
+ Specify an event condition... le 4d | [s 





MMatuk- -|| >00 HERE 产品 销售 区 域 2 
#2 Manace the task execution rules... 


EJ Schedule the agent... 
I) Reorder the tasks... 


8] REE 
c fii SALES 
Eo 
国产 品名 称 
国产 品类 型 
置地 区 名 称 
车 统计 日 期 

























Navigate the folders or search to find the report, query, analysis, or report view to indude in the agent. Search that the task execution 





Cognos > My Folders > 产品 销售 区 域 2 






Entries: [1 -R JO | «o» 





| |NameS$ 


© D 销售 明细 







O Lh] 销售 汇总 表 







vent list, Select to specify 


Entries: 1 - 2 












V [ueste [| wow 





Specify values... 








alt |, ma x| 


完成 Internet 1008 ~ . 


23-22 Cognos Event Studio Report 创建 
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4. Job 
一 个 作业 可 以 包括 多 个 报表 、 报 表 视 图 或 者 其 他 作业 ， 它 的 创建 如 图 23-23 所 示 。 可 以 





在 实际 使 用 过 程 中 将 一 系列 的 行为 打包 成 一 个 作业 来 作为 任务 。 


New -— Event Studio - Findows Internet 5:4: 04-4 





THEO RHO SEV KEXA IAT) BH) 


ao M IE | http: //localhost:9300/p2pd/servlet/dispatch& viitti X DP- 
































** 4 [ag En raae. Ere -.. x [Emma Era- Wem... wmm. | | Io 团 d 2XEO- Grao ” 


Edit View Insert Actions 














E 
"j| aam 销售 报告 产品 销售 区 域 2 销售 明细 














Select the job (Navigate) Help G 
Í| Navigate the folders or search to find the job to include in the agent. Search 
产品 销售 区 域 2 Coanos > Public Folders 
= Wil SALES 
pip 
W 产品 名称 
国产 品类 型 
田地 区 名 称 


reum rder the tasks.. 
































[R tiit ARA 














完成 iz Q Internet 8 100% ~ 
图 23-23 Cognos Event Studio Job 创建 


5. Agent 介绍 

Agent RE) 用 来 监控 实例 的 数据 并 在 事件 发 生 时 执行 指定 的 任务 。 代 理 运 行 时 ， 会 检 
得 事件 的 发 生 条 件 是 否 满足 。 如 果 满 足 代 理 执行 的 条 件 ， 那 么 将 执行 指定 的 任务 。 代 理 的 运 
行 任务 有 两 种 方式 : 丁 全 部 任务 ， 二 是 按照 指定 的 方式 顺序 执行 任务 。 

6. Advanced jT 
€ Database Deus (数据 库 更 新 ): 通过 添加 数据 库 中 的 存储 过 程 来 更 新 数据 库 的 方式 。 
€ WebServices (Web 服务 ): 使 用 Web Services 服务 的 方式 。 
€ Export CFE): 可 以 将 选项 导出 到 指定 的 位 置 。 
o 
e 
o 

















Import CFA): 可 以 将 选项 导入 到 目标 位 置 。 
Content Maintenance Task. 内容 维 护 ): 内 容 存 储 库 的 维护 方式 。 
Migration Task (ZERE): 上 度量 标准 的 操作 方式 。 








23.0 Framework Manager 建 模 工具 


Framework Manager 是 用 来 组 织 和 友 布 元 数据 模型 的 工具 ,模型 是 包含 了 物理 信息 和 业务 
信息 的 一 个 或 多 个 数据 源 的 元 数据 集合 ， 为 报表 应 用 提供 维度 、 查 询 主 题 和 其 他 相关 的 信息 ， 
如 图 23-24 所 示 。 
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-oe Salesd 一 Franework Nanager 





File Edit View Project Repository Actions Tools Help 




















Dig H| Aro a | mm X || E- [nem ng 
€ =} 1 F Sales4 
Project Viewer Ax | Tools jap Ex 
= B Sales4 B Sales4 tj Summary fa Search & Dependencies 
= BI_TARGET 
mg SALES 
(| 1p 23 BI TARGET Design Language 
(M 产品 名 称 ir 
ui 产品 类 型 $= Explorer S9 Diagram (I]] Dimension Ma : 
— » Active Language 
M Eee [ky  ——— e] 
1 r. 
E ss (8) Data Sources 2 
i 统计 日 期 
Ee (Statistics O — | 
Tg Perenetar Maps Parameter Maps 
- (iai Packages EE Class Count 
GÀ) salesd4 ] Namespace 1 
题 packages lll] Query Subject 1 
(I) Query Item 6 
8 Data Source 1 
(Bl Package 1 
Total 10 
Properties 
Properties | Language 
完成 NUM 


图 23-24 Cognos Framework Manager 界面 


模型 提供 了 一 种 与 源 数据 的 信息 相关 的 业务 视图 ， 用 来 创建 、 分 析 和 得 询 报表 。 该 业务 
视图 可 以 : 
e 组 织 条 目 。 
使 用 数字 、 货 币 、 日 期 、 时 间 等 进行 条 目的 格式 化 。 
多 语言 的 配置 ， 比 如 条 目 名 称 、 描 述 、 数 据 等 选项 。 
将 自动 生成 的 SQL 查询 发 给 关系 型 数据 源 。 
默认 提示 设置 。 
特别 地 : 
e 可 以 修改 Framework 中 的 模型 来 确保 查询 能 及 时 、 安 全 、 多 形式 、 有 效 地 发 给 数据 源 。 
e 还 可 以 指定 查询 的 规则 ， 限 制 用 户 访问 数据 中 特定 的 行 或 列 。 
e 另外 ， 数 据 关 系 模 型 还 可 以 为 用 户 隐藏 复杂 的 数据 。 


23.9.1 菜单 介绍 


AX Cognos Framework Manager 亲 早 的 介绍 见 表 23-11. 














R 23-11 Cognos Framework Manager 菜单 
菜 "m T 菜单 说 明 
New 新 建 
m 
File 
关闭 
关闭 所 有 
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File 


Edit 


View 


Project 


Repository 


Save 

Save As 

Save AII 
Manage Project 
Page Setup... 
Print Preview 
Print 

Exit 


Undo 


Redo 

Cut 

Copy 

Paste 

Delete 

Rename 

Select All Simple Objects 
Go To 

Project Viewer 
Properties 

Tools 

Status Bar 

Refresh 

Verify Model... 
Language 

Project Function List... 
Edit Governors... 
Evaluate Automatically 
Branch to... 

Merger from... 

Sessions Parameters... 
Logon As... 

Logoff... 

View Transaction History... 
Run Script... 
Synchronize... 

Create Segment... 

Link Segment... 


Get Latest Version 


CHE 
说 明 
保存 
另存 为 
保存 所 有 
管理 工程 
页 面 设置 
打印 预览 
打印 
退出 
撤销 
重 做 
BIH 
复制 
粘贴 
删除 
重 命 名 
选择 所 有 简单 的 对 象 
跳 转 《返回 、 前 进 、 向 上 一 级 、 模 型 根 元 素 ) 
显示 工程 视图 














显示 属性 窗口 








显示 工具 窗口 
显示 状态 栏 
刷新 

模型 验证 
选择 语言 
工程 函数 列表 
编辑 

自动 评估 


查看 事务 历史 
运行 脚本 
同步 

创建 段 
链接 段 
获取 最 新 版 本 
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Repository 
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Actions 


Tools 


Help 


Check Out 

Check In... 

Undo Check Out 

View History 

Add Project To Repository... 
Connection Manager... 

Create 

New Parent 

Edit Definition... 

Merge in New Query Subject 
Merge in New Regular Dimension 
Define Query Set... 

Format... 

Convert To Query Subject 
Convert To Data Source QuerySubject 
Convert To Regular Dimension 
Convert To Measure Dimension 
Remap To New Source 

Edit Package Inclusion... 
Specify object Security... 

Run Metadata Wizard... 

Export Model... 

Package 

Test 

Verify Selected Objects... 

Run Model Advisor... 

Show Object Dependencies... 
Create Star Schema Grouping... 
Detect Relationships... 
Determine Aggregation Rules 
Determine Object 

Find Report Dependencies 
Find All Secured Object 

Model Report... 

Content 

About Framework Manager 


Cognos on the Web 


CHE) 

说 — Hj 
S 
全 入 
撤销 检 出 
查看 历史 
添加 工程 到 知识 库 
连接 管理 
创建 
IER 
编辑 定义 
在 新 查询 主题 中 合并 
在 狐 规 则 的 维度 里 合并 
EXAME 
格式 化 
转换 成 得 询 主题 
转换 成 数据 源 但 询 主 题 
转换 成 规则 的 维度 
转换 成 度量 的 维度 
重新 映射 到 新 源 
重新 编辑 包 
指定 对 象 安全 性 
运行 元 数据 问 导 
导出 模型 
包 
测试 
验证 选择 的 对 象 
运行 模型 顾问 
展示 对 象 依赖 
创建 星 形 结构 分 组 计划 
查询 对 象 之 间 的 关系 
确定 聚合 规则 
确定 对 象 
查询 报表 依赖 关系 
查询 所 有 安全 的 对 象 
模型 报表 
上 下 文 环境 


关于 Framework 管理 器 











Web 上 的 Cognos 


23.92 工作 区 


1. Project Viewer 
Project Viewer (t H ÆA 4S) 如 图 23-25 所 示 。 











[ma Stir ELA 
[+] (Ejl Data Sources 
四 Parameter Maps 
=- Packages 

AB 产品 宵 上 区域 2 





图 23-25 Cognos Framework Manager Project Viewer 工作 区 . 


Project Viewer 中 的 模型 〈 元 数据 集 ) 包括 以 下 各 主题 。 

e MATE: XII TERR. 

e 数据 源 : 定义 数据 源 。 

e 参数 映射 : 在 报表 运行 时 ， 使 用 参数 创建 可 符 换 的 得 询 主题 。 

e €: 定义、 修改、 发 布 包 等 操作 。 

2. Project Info 

Project Info Cm HFR) 是 Framework 的 建 模 工作 区 ， 可 以 创建 查询 主题 、 定 义 模型 天 
系 、 设 计 维 度 及 度量 等 ， 包 括 以 下 内 容 。 

1) Explorer: 显示 三 询 主题 定义 ， 如 图 23-26 pm. 














i= Explorer |æ Di agram [LE] Dimension Map 


图 23-26 Cognos Framework Manager Project Info Explorer 工作 区 


2) Diagram: 模型 天 系 定义 ， 如 图 23-27 PZR. 


2 


ic Explorer qe Diagram | 四 Dimension Map 


ID 
产品 名 称 
产品 类 型 








图 23-27 | Cognos Framework Manager Project Info Diagram 工作 区 





3) Dimension Map: 维度 和 上 度量 的 定义 ， 如 图 23-28 Hrs. 


$2 Explorer | ge Diagram 1i Dimension Map | 


Dimensions - Scope Mode (Multiple) 





十 日 期 产品 名 称 
十 日 期 产品 名 称 
IAD FRAR 
二 日 其 产品 名 称 





[iT! 


rn 


o SAES =E 数量 
地 区 名 称 LL, sg 
地 区 名 称 (A11) 
地 区 名 称 








图 23-28 Cognos Framework Manager Project Info Dimension Map 工作 区 


3. Properties 


Properties (属性 ) 用 于 定义 各 得 询 主题 的 属性 ， 如 图 23-29 PR. 


Properties 
Fraperties | Language 


Hame 

Description 

Last Changed 

Lazt Changed Br 
Model Comments 
Screen Tip 
Security Filters 
Erternalirze Method 


Externalize kuto Summary 
Status 


O x 


SALES 


2007-05-25T14:43:30 


Anonrmaus 


{Click to edit.? 
iud 

false 

Valid 





图 23-29 Cognos Framework Manager Properties 工作 区 


4. Tools 
Tools (TĦ) 包括 以 下 3 个 选项 卡 。 
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1) Summary (£5): 分 Project, Statistics, Tasks 三 个 标签 ， 如 图 23-30 所 示 。 其 中 ， 
Project 显示 活动 的 语言 信息 , Statistics 统计 对 象 的 数量 信息 ,Tasks 可 进行 一 系列 任务 的 操作 。 
2) Search (AW): 依据 条 件 得 询 对 象 等 ， 如 网 23-31 HZR. 

















Tools Bx 
tj Summary | 名 Search & Dependencies Tools Dx 
- "| Summary S h Dependencies 
Project ^ tfj f] Searc | & i 
Design Language Search string: 9 found [ Subset 
英文 [EEJ -| Search | Y | 


Active Language 
-一 Condition: contains 
[英文 了 | Search In: BI_TARGET 
Search Class: (All Classes) 
Search Property: (All Properties) 


Statistics ^ 
Object Property Value 

Cla C t 
一 P ESSE. BI_TARG... ”统计 日 其 
Namespace 1 TP 统计 日 其 BI TABG... ”统计 日 期 
lll] Query Subject 1 = 统计 日 其 BI_TARG... ”统计 日 其 
加 Query Item 9 mx 统计 日 期 (A11) BI_TARG. . .统计 日 期 (A11) 
T Dimension 4 m 统计 日 期 BI TABG... ”统计 日 其 
BM 1 四 sese Bum BI TABGC... ”统计 日 期 

ax NM 四 统计 日 其 BI TARG... [BI TARCET]... 
T a Scope Relationship 3 TGA <... BI_TARG... 统计 日 期 <=>... 
Total 19 时 统计 日 其 <... BI_TARG... [BI_TARGET]... 
Tasks 全 
BI TARGET 


Run Metadata Wizard... 


Find Report Dependencies 
SALES 


Edit Definition... 
Find Report Dependencies 








Bulk Replace... | 





23-30 Cognos Framework Manager 23-3] Cognos Framework Manager 
Summary 工作 区 Search 工作 区 


3) Dependencies (依赖 ): 往 询 显示 东 对 象 的 依赖 关系， 如 网 23-32 Pro. 


Tools 





fj Summary 名 Search 总 Dependencies | 


Select an object to view its dependencies 








Drag & drop an object from the Project 


Viewer here to view its dependencies 





Dependent objects 





No Dependencies Found 





| Show Object ld 








图 23-32 Cognos Framework Manager Dependencies 工作 区 
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29.10 Transiormer 介绍 


Cognos Transformer 以 多 维 模 型 的 设计 理念 方式 将 多 种 数据 源 (Source) 转化 为 立方 体 
(Cube)， 如 图 23-33 Br. 


梧 Transforaer — SALES2. pyj 





File Edit View Run Diagram Tools Security Window Help 


DSH o4:m-omEE:usg 









lll Dinension Nap 
o fiam 
产品 名 称 | ”地 区 名 称 


S- BI TARGET 









illl Data Sources "JE Neasures f- lolx) ” PowerCubes BAR =» Custom Views BAB 
lili L, AE D sse: 


T 数量 
(M. 统计 日 期 


Ready Fẹ ZEA F 


23-33 Cognos Transformer 界面 








Cognos Transformer TV 223 Xil 2E, FANER PELEAS NEA, HEEE 
来 衡量 业务 的 成 效 。 


23.10.1 Data Sources 





Data Sources〈 数 据 源 ) 窗口 用 于 模型 的 数据 源 设置 ， 如 图 23-34 所 示 。 数 据 源 类 型 包括 
以 下 儿 种 : 

€ Cognos Report: 使 用 Cognos 报表 作为 数据 源 。 

€ Cognos Package: 使 用 Cognos 包 作 为 数据 源 。 

€ Impromptu Query Definition C.igd XF): 使 用 .iqd 文件 作为 数据 源 。 

€ Delimited-field text: 以 ASCI 文本 文件 作为 每 条 记录 的 输入 。 

€ Access table: 使 用 微软 的 Access 表 作 为 数据 源 。 

@ Access query: 使 用 微软 的 Access 的 .mdb 文件 作为 数据 源 。 

€ Excelcrosstab: 使 用 微软 的 Excel 的 crosstab 文件 作为 数据 源 。 


€ Excel database: 使 用 微软 的 Excel 数据 库 作 为 数 UL 
py. pe BE 

€ PowerHouse portable subfile: 使 用 Cognos 的 | 
PowerHouse 子 文件 作为 数据 源 。 

€ Fixed-field text: 以 ASCII 文本 文件 作为 每 条 记录 
的 输入 ， 每 行 结尾 以 text 行 分 隔 符 作 为 标识 。 

€ Fixed field and record without CR LF: LÀ ASCII X: 
本 文件 作为 每 条 记录 的 输入 ， 每 行 结尾 没有 text 图 23-34 Cognos Transformer 数据 汤 
行 分 隔 符 。 

HX: Cognos Transformer 来 早 有 的 介绍 见 表 23-12. 








[加 统计 日 期 











R 23-12 Cognos Transformer 菜单 


数据 源 类 型 jf — XN 
Cognos Report 可 以 从 报表 中 导入 条 目 
Cognos Package 可 以 从 多 维 模 型 包 中 导入 条 目 


.iqd 文件 是 从 Cognos Series 7 Impromptu 和 Cognos 8 的 Framework Manager 框架 中 (如 外 
部 化 得 询 文件 ) 生成 的 

一 个 访问 表 , 输入 值 是 从 一 个 Microsoft Access 文件 得 到 的 。Transformer 采用 微软 的 ActiveX 
数据 对 象 CADOO 的 驱动 程序 来 访问 数据 

访问 查询 , 源 表 中 描述 的 一 个 Microsoft Access 查询 (.mdb 文件 )。Transformer 使 用 Microsoft 


Impromptu Query Definition 


Access table 


Access query ActiveX 数据 对 象 CADO) 的 驱动 程序 来 访问 数据 。 或 者 从 可 以 支持 ODBC 的 数据 库 服务 器 
中 的 源 列 运行 SQL 去 查询 .mdb 文件 
Excel crosstab LH Excel 交叉 表 ， 输 入 值 是 从 一 个 Excel 交叉 表 文 件 得 到 的 


与 Excel 资料 库 ， 输 入 值 是 从 一 个 Microsoft Excel 电子 表格 数据 库 文 件 得 到 的 。 在 
Transformer 中 ， 从 表 或 区 域 中 的 选择 区 域名 称 

随 看 数据 仓库 便携 子 文件 ， 输 入 值 是 从 一 个 Cognos 公司 数据 仓库 便携 子 文件 得 到 的 。 特 
PowerHouse portable subfile | 别 是 子 文件 的 便携 式 字 典 〈.psd) 的 文件 或 数据 〈.ps) 文件 。 接 受 默认 的 字符 集 或 指定 一 个 
蔡 代 值 

采用 固定 字段 中 的 文本 ， 输 入 值 是 从 一 个 ASCI 文本 文件 得 到 的 。 每 个 字段 开始 于 紧 接 前 
场 字 节 ， 每 个 字段 的 宽度 占据 了 指定 的 字 节 数 。 每 一 行使 用 文本 行 结束 符 结 

输入 值 是 从 一 个 ASCII 文本 文件 得 到 的 。 每 个 字段 开始 于 紧 接 前 场 字 节 ， 每 个 字段 的 宽度 
占据 了 指定 的 字 市 数 。 记 录 不 以 一 个 文本 行 分 隅 符 来 结 


23.10.2 Dimension Map 


Dimension Map 是 维度 设计 的 窗口 ， 如 图 23-35 所 示 。 根 据 数据 源 的 表 或 者 视图 信息 ， 
可 以 进行 业务 报表 维度 的 设计 工作 ， 包 括 维度 、 层 、 分 类 等 内 容 。 


Excel database 


Fixed—field text 











Fixed field and record without 











lll Dimension Nap 
| © 统计 日 其 地 区 名 称 
| Fass | ass 
-| 





图 23-35 Dimension Map 
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23.10.3 Measures 








Measures 是 度量 窗口 ， 用 于 创建 度量 标准 ， 如 图 23-36 所 示 。 可 以 从 Data Sources 窗口 
中 直接 拖 动 列 到 该 窗口 进行 度量 的 目 动 创 建 ; 也 可 以 在 该 窗口 中 单 击 鼠标 右键， 在 弹出 的 快 
捷 采 单 中 选择 Insert Measures 命令 来 目 定 义 一 个 上 度量。 目 定 义 的 度量 需要 在 “类 型 ”选项 卡 
中 指定 “ 列 ” 操 作 。 




















23-36 Measures 窗口 


23.10.4 PowerCubes 





PowerCubes 是 立方 体 窗 口 ， 如 图 23-37 所 示 。 维 度 和 度量 创建 完成 之 后 ， 束 可 以 使 用 
Transformer 的 自动 生成 立方 体 功能 鲁 来 创建 一 个 立方 体 多 维 模型 。 立 方 体 创建 无 误 后 ， 在 该 
窗口 中 用 鼠标 右键 单 击 立 方 体 名 ， 在 弹出 的 快捷 菜单 中 选择 Publish PowerCube as a Data 
Source and Package 命令 来 发 布 立 方 体 。 发 布 成 功 的 立方 体 , 在 Cognos Connection 中 可 以 使 用 
Analysis Studio 来 进行 分 析 和 制作 多 维 报表 的 操作 。 




















". PowerCubes 


23-37 PowerCubes 窗口 


23.10.5 Customer Views 





Customer Views 是 目 定 义 客 户 视 图 窗口 ， 如 图 23-38 所 示 。 
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HE Custom Views PE 





图 23-38 BHBoEX AE 


23.10.6 Signon 
当 创 建立 方 体 的 时 候 ， 可 以 创建 一 个 Signon 以 便 Transformer 安全 访问 数据 源 。 
Transformer 包含 两 种 类 型 的 Signon. 
€ Data Source Signon: 可 以 从 .iqd 文件 导入 ， 当 Cognos 8 数据 源 定义 了 一 个 没有 密码 联 
系 的 内 容 管理 时 ， 同 样 也 可 以 在 Transformer 中 被 创建 。 
€ Cognos 8 Signon: 可 以 在 命名 空间 外 配置 用 户 映 份 验证 。 





23.11 Cognos PowerPlay 


PowerPlay 是 数据 探 察 分 析 功 能 ， 如 图 23-39 所 示 。 


t PowerPlay — [PPlay2 of Sales3 (Explorer)] 





€ File Edit View Insert Explore Calculate Format Tools Window Help w 一 一 一 一 一 一 一 - = I — 
| Das | [e| | s. fu na sæl [e oo| eee [mma [ic [EC |f e wa (Ia | 2s | lg | [|n | 
S [ pares | | FRopucr Nam | | REGTON mane | [ ANOUNTS | 





RRRA 红木 家 具 地 中 海 家 具 现代 家 有 具 






D:\Backap\ 我 的 立 档 \TransformerPon 
* DATES 
+ PRODUCT NAME 
+ REGION NAME 
此 MEASURES 





图 23-39 Cognos PowerPlay 界面 
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23.11.1 
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米 单 介 绍 


HX: Cognos PowerPlay KAHJA ILK 23-13. 


File 


Edit 


View 


表 23-13 Cognos PowerPlay 菜单 


New 

Open 

Close 

Close All 

Save 

Save AS... 

Publish to Upfront... 
Publish as HTML... 
Duplicate As 

Page Setup 

Print Preview 

Print 

Deployment Options... 
Shared Dimensions 
Preferences 

Exit 

Undo 

Redo 

Copy 

Paste Special... 
Delete 

Find 

Select 

Rename Label 
Normal 

Page Layout 

Page Width 
ToolBars 
Dimension Viewer 
Dimension Line 
Title 

Status Bar 

Legend 

HighLight Subset 
Calculated Categories 


Explain 


说 
新 建 
打开 
关闭 
关闭 所 有 
保存 
男 存 为 
发 布 到 前 期 
当成 HTML 发 布 
复制 


Tas 


图 例 
oet T 
计算 类 型 


解释 


明 


CHE) 





菜 Ñ 子 菜 单 说 明 
互 换 操作 ， 有 3 种 模式 ， 行列 互 换 、 行 层 互 换 和 列 层 互 换 
长 变 报表 显示 模式 ， 包 括 交 又 列表 、 柱 形 国 、 癸 形 国 、 线 性 风 
^t 
mmi 
Wt. ETAR 
MTER 
CET 
EET 
转换 成 Repeater 
Add... 添加 
ua 
EIU 
标题 、 页 头 、 页 尾 设置 
Format 
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Xo M 子 菜单 说 明 
Tools -一 


23.11.2 ”工具 栏 
有 关 Cognos PowerPlay 工具 栏 的 介绍 见 表 23-14. 


表 23-14 Cognos PowerPlay 工具 栏 








LEES bi W 
E m 
R 在 Explorer 与 Reporter 模式 之 问 转换 
&| 以 简单 的 柱 形 图 形式 展示 
图 | 显示 值 不 为 0 的 行 和 列 以 柱 形 图 集 形式 展示 
øl » 以 单条 线性 图 形式 展示 
| | usse: | — — 


23.11.93. HEREA] 
Cognos PowerPlay 维度 视图 见 表 23-15. 


表 23-15 Cognos PowerPlay 维度 视图 


E " BE Gd m cube EX 
x |» — 1 


2942. 本草 小 结 


1) 在 本 章 ， 首 先 介 绍 了 Cognos 的 历史 、 现 状 。 接 下 来 ， 又 分 别 介 绍 了 Cognos 的 开发 工 
有 具 的 使 用 , 比如 Query Studio, Report Studio, Analysis Studio, Event Studio, Framework Manager. 


Transformer 等 工具 。 








2) Cognos 通过 报表 展示 的 数据 ， 是 基于 统一 的 元 数据 模型 。Cognos 强大 的 报表 制作 功 
能 可 以 制作 出 满足 任何 需求 的 报表 ， 其 基于 B/S 的 使 用 方式 在 提供 方便 的 同时 ， 还 将 部 著 成 
本 和 管理 成 本 降 到 最 低 。Cognos 还 可 以 同 数据 挖 气 工 具 及 统计 分 析 工 具 搭 配 使 用 ， 以 增强 决 
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策 分 析 的 功能 。 

3) Cognos 的 特点 : 方便 的 基于 B/S 架构 的 报表 开发 工具 ， 强 大 的 报表 制作 、 部 着 、 疏 
布 、 管 理 功能 ， 快 速 的 数据 访问 、 分 析 能 力 ， 强 大 的 安全 性 保障 ， 更 多 的 用 户 群 体 。 

4) Cognos Connection 是 Cognos 集 设计 和 管理 于 一 体 的 报表 工具 。 

Cognos 安装 成 功 以 后 ,用 户 束 可 以 登录 到 Cognos Connection 界面 进行 报表 的 开发 和 管理 
Ts 

5) 用 户 使 用 Query Studio 可 以 目 定 义 生 成 一 些 徐 单 的 报表 。 在 用 Framework Manager 友 
布 元 数据 模型 之 后 ，Query Studio 就 可 以 使 用 该 元 数据 进行 一 些 简 单 的 运算 ， 以 实现 动态 的 业 

6) Report Studio 是 为 用 户 设计 开 友 复杂 报表 的 专业 开 友 工具 。 其 编辑 和 展示 功能 要 比 
Query Studio 强大 得 多 。 

7) Analysis Studio 可 以 开 友 比较 复杂 的 报表 。 其 分 析 功 能 要 强 于 了 Report Studio， 但 是 样 
式 稍微 欠缺 。 用 户 在 使 用 Analysis Studio 的 过 程 中 ， 可 以 对 立方 体 模型 中 的 数据 进行 切片 、 
钻 取 等 专业 操作 。 

8) Event Studio 可 以 对 事件 发 生 改变 的 条 件 以 及 事件 的 变化 结果 进行 相关 设置 。 比 如 ， 
在 每 天 次 展 0 点 时 分 发 送 一 封 邮件 ， 每 月 星期 一 早上 6 点 目 动 生成 一 份 报表 等 。 

9) Framework Manager 是 元 数据 模型 的 制作 工具 。 在 制作 完 元 数据 模型 后 ，Framework 
Manager 还 将 这 些 模型 友 布 到 Cognos 的 设计 环境 中 ， 这 样 Query Studio 和 Report Studio 才能 
正常 设计 和 开发 报表 。 

100 用 户 通 过 Transformer 分 析 数 据 源 ， 然 后 建立 维度 和 度量 ， 最 后 生成 立方 体 模型 。 
方 体 模型 是 OLAP 分 析 数 据 的 基础 。 

11) PowerPlay 用 于 制作 基于 立方 体 数 据 模 型 的 多 维 分 析 报 表 。 
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24% Informatica 的 安装 与 快速 入 | 


本 章 目标 

工具 篇 介绍 了 Informatica 软件 的 详细 使 用 说 明 ， 本 章 将 继续 深入 讲解 Informatica 的 安装 
与 快速 开发 。 其 中 Informatica 的 安装 分 服务 器 安装 和 客户 问安 装 两 部 分 。 在 Informatica 快速 
入 门 中 ， 本 章 将 以 一 个 实例 来 介绍 Informatica 的 开发 过 程 ， 使 用 户 在 学 习 Informatica 的 功能 
以 后 ， 能 快速 地 进行 企业 级 项 目的 开发 工作 。 

PIRE, KKE: 

€ Informatica PowerCenter [fl 5-28 RIZ JP sm RE R o 

€ Informatica PowerCenter 工具 的 使 用 流程 。 

@ Informatica PowerCenter 快速 入 门 。 











meleg 


24.1 Informatica PowerCenter 的 安装 方案 








Informatica PowerCenter Z3 ^j 3g lE 29 ZR xg zz REGIA Pg zx. IUS Informatica 
PowerCenter 的 用 户 不 妨 将 其 想象 为 Oracle 的 安装 ， 因 为 Oracle WRENN Hi 5-3 rg A 
客户 端的 。 

24.1.1 安装 前 的 准备 
在 安装 Informatica PowerCenter 前 需要 创建 一 系列 数据 库 执行 脚本 ， 具 体 如 下 : 
1. 创建 表 空 间 ， 用 于 存放 数据 库 的 数据 


CREATE TABLESPACE BI ETL DATAFILE 'D:\oracle\product\10.2.0\oradata\BI\ BI ETL.dbf 
SIZE 1000M REUSE AUTOEXTEND ON NEXT 100M; 


这 里 ， 保 存 位 置 、 空 间 大 小 需要 按照 实际 情况 灵活 改变 。 
2. 创建 域 用 书 并 分 配 权 限 ， 用 来 管理 二 


CREATE USER "BI DOMAIN" IDENTIFIED BY "BI DOMAIN" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 

GRANT "CONNECT" TO "BI DOMAIN"; 

GRANT "DBA" TO "BI DOMAIN"; 
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GRANT "RESOURCE" TO "BI DOMAIN"; 

GRANT UNLIMITED TABLESPACE TO "BI DOMAIN"; 
GRANT SELECT ANY TABLE TO "BI DOMAIN"; 
ALTER USER "BI DOMAIN" DEFAULT ROLE ALL; 


3. 创建 资源 库 用 户 并 分 配 权 限 


CREATE USER "BI RESOURCE" IDENTIFIED BY "BI RESOURCE" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 

GRANT "CONNECT" TO "BI RESOURCE"; 

GRANT "DBA" TO "BI RESOURCE"; 

GRANT "RESOURCE" TO "BI RESOURCE"; 

GRANT UNLIMITED TABLESPACE TO "BI RESOURCE"; 

GRANT SELECT ANY TABLE TO "BI RESOURCE"; 

GRANT CREATE ANY VIEW TO "BI RESOURCE"; 

ALTER USER "BI RESOURCE" DEFAULT ROLE ALL; 


4. DEZE NH AHNEN IR 


CREATE USER "BI DATAANALYZER" IDENTIFIED BY "BI DATAANALYZER" DEFAULT 
TABLESPACE "BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT 
UNLOCK; 

GRANT "CONNECT" TO "BI DATAANALYZER"; 

GRANT "DBA" TO "BI DATAANALYZER"; 

GRANT "RESOURCE" TO "BI DATAANALYZER"; 

GRANT UNLIMITED TABLESPACE TO "BI DATAANALYZER"; 

GRANT SELECT ANY TABLE TO "BI DATAANALYZER"; 

GRANT CREATE ANY VIEW TO "BI DATAANALYZER"; 

ALTER USER "BI DATAANALYZER" DEFAULT ROLE ALL; 


5. ETARA AHN AIR 


CREATE USER "BI METADATA" IDENTIFIED BY "BI METADATA" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 
GRANT "CONNECT" TO "BI METADATA"; 

GRANT "DBA" TO "BI METADATA"; 

GRANT "RESOURCE" TO "BI METADATA"; 

GRANT UNLIMITED TABLESPACE TO "BI METADATA"; 

GRANT SELECT ANY TABLE TO "BI METADATA"; 

GRANT CREATE ANY VIEW TO "BI METADATA"; 

ALTER USER "BI METADATA" DEFAULT ROLE ALL; 


24.1.2 MKi 23! iC pe 


在 做 完 准 备 工 作 之 后 ， 开 始 安 装 Informatica PowerCenter 服务 器 。 首 先进 入 Informatica 
PowerCenter 的 安装 目录 ， 双 击 “installexe” 安 装 文 件 ， 弹 出 安装 界面 ， 如 网 24-1 所 示 。 
EFE “Server” mMm, RAMIE Informatica PowerCenter 服务 器 端的 安装 ， 如 图 24-2 所 示 。 
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F Informatica PowerCenter 8.1.1 











INFORMATICA€ 


PowerCenter? 8.1.1 


Please select an option to install 


G Server 
© Client 
© Reports 


Note: Before you continue, please read the 
PowerCenter Installation and Configuration Guide 
and Release Notes located in the root directory 
of the PowerCenter Documentation CD and in the 
cumentation Center at http://my. informatica. com. 


Browse DVD 人 





INFORMATICA 


24-1 Informatica PowerCenter 的 安装 界面 


随后 进入 Informatica PowerCenter 服务 器 的 安装 欢迎 界面 ， 如 图 24-1 所 示 。 


33 Informatica PowerCenter 8.1.1 


INFORMATICA Welcome 


© | Welcome to Informatica PowerCenter 8.1.1. You can use this wizard 
® Licansa ra to install PowerCenter 8.1.1. 


® Installation Prerequisitaz 
@ naiataion Sat Copyright © 1999-2006 Informatica Corporation. All rights reserved. 
© v & niti License Kay This wizard guides you through installation of Informatica 
> M PowerCenter 8.1.1. Click Nextto start the installation. Click Cancel at 
(€ ^oplicaion Server yf anytime to stop the installation and exit the wizard. 

© Pralnsiallaiion Surri 

I@ insting : 

© Drain Gryuraior 

Q node Goniiguraiian 

Q nuinenticadan 

© Fepository Conüguration 

© Postlnstallation Surnrriar; This Software is protected by U.S. Patent Numbers 6,208,990; 


Previous 





24-2 Informatica PowerCenter 服务 器 的 安装 欢迎 界面 
选择 正确 的 License Key 文件 ， 如 图 24-3 所 示 。 


“ Informatica PowerCenter 8.1.1 







INFORMATICA PowerCenter License Key 


© Select the license key file: 


© Installation Prerequisites C:\Documents and Settings\Administratorlicense key 
(Eie ET DTE Set 








| Applicator Sarar Co i. 
È Pre-Installatian Suiriiar 
È Installing.. — | 
© Drain Configuration 


© node configuration 


© Repository Goniiyuraiion 


© PostInstallation Surnrriar; 


Previous 


24-3 PowerCenter License Key 文件 选择 问 导 
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Informatica PowerCenter Jt 45-28 I^] 2288 Vc $68 x E 3RSKIu] Se, ull 24-4 所 示 。 


“Y Informatica PowerCenter 8.1.1 


INFORMATICA 


© Installation Sat 
© DA £ hil License Kay 
© Inasiallaiior Directory 


QS pplication Serer C onii. 


È Pra-lnsiallaiiorn Surri: p 
© Insialliny... | 

© Dorrairrs ;onfigurátion 
© Hode Goniiyuraiiorn 

Q9 Mitianiicaiion 


Q9 Repository le 


© PosiInstallation Surnrriar; 


24-4 Informatica PowerCenter 服务 器 的 安装 设备 及 软件 要 求 癌 导 
在 Informatica PowerCenter 服务 絮 安 装 过 程 中 ， 需 要 提前 创建 以 下 4 个 数据 库 。 





Installation Prerequisites 


PowerCenter Repository Database: Oracle, DB2, SQL Server 
(Windows only), Sybase 

Data Analyzer Repository Database: Oracle, DB2, SQL Server, 
Sybase 

Metadata Manager Repository Database: Oracle, DB2, SQL 
Server, Sybase 

Domain Configuration Database: Oracle, DB2, SQL Server, 


Sybase 


Atleastthree database user accounts are required to complete 
the installation. 


Disk Space Requirements 


icu lb Edition installation: 2.3 GB 


Previous 








e 资源 库 : 存储 所 有 的 元 数据 信息 。 
e 数据 分 析 库 : 存储 在 数据 分 析 过 程 中 产生 的 数据 参数 指标 。 


@ 元 数据 管理 库 : 在 设计 过 程 中 产生 的 
e 域 配 置 数 据 库 ， 和 存储 域 配置 


Informatica PowerCenter 服务 器 安装 模式 癌 导 如 图 24-5 所 示 。 


» Informatica PowerCenter 8.1.1 


INFORMATICA 


© DA £ mil License Kay 
© Insiallaiior Directory 


© pplication Server C onfli.. 


© Pra-lnsiallaiior Sfrrins 2 


(CRES J 
© Dorrrain Configurátion 


® ode Cornñguratiori 
© Mihianiicaiion 
F'enasitoary Confiquratiari 


© Posilrnsiallaiion Surnrriar 


Installengemere he Wacrovisian 


Installation Set 


O Complete 


Includes the following components: 
' PowerCenter Services 


' PowerCenter Data Analyzer (dashboards, reports, and graphs) 


* PowerCenter Metadata Manager 


© Custom 


Choose the PowerCenter components to install. 


Previous 








24-5 Informatica PowerCenter 服务 器 安装 模式 向 导 


建议 初学 者 和 初级 开发 人 员 全 部 选择 安装， 这 样 可 以 全 面 地 了 解 Informatica PowerCenter 


服务 器 的 工具 ， 如 图 24-6 PZR. 


一 系列 数据 及 参数 指标 均 保存 在 该 数据 库 中 。 
过 程 中 的 参数 指标 。 
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BE s Cie PowerCenter 8.1.1 


INFORMATICA Advanced Edition Components 


d 
x PowerCenter Services 


be PowerCenter Data Analyzer 


< d MIT T PowerCenter Metadata Manager 
DA & mil License rey 


Select the PowerCenter components to install: 


© Installation Directory 

© ^policati Server Config. 
© Pre-Installatian Suiriimary 
HÒ nsialliny... P 
© Dirai conüguration 

© node Goniiguraiion 

© nuinentication 


© Repository Goniidguraiior 


24-6 Informatica PowerCenter 服务 器 组 件 问 导 


选择 Data Analyzer/Metadata Manager License Key (数据 分 析 器 和 元 数据 管理 器 的 License 
Key 文件 )， 如 图 24-7 所 示 。 


“\ Informatica PowerCenter 8.1.1 





INFORMATICA iet data Manager License Key 


Select the license key file for Data Analyzer/hetadata Manager 





C:Documents and SettingsV&dministratorüas license.xml | 





© Insiallation Directory 

© ^oplication Serrar Conii 
Q9 Pre-Installatiari Siurrifriary 

© rialliny... p 
© Dirai Configuration 

© node Goniiyuraiion 

© nuinentication 


Renosiiory Confiqguratiari 


24-7 DA&MM License Key 文件 问 导 


为 数据 分 析 器 和 元 数据 管理 器 选择 Application Server 〈 应 用 程序 服务 器 ) 中 间 件 ， 
Informatica 默认 集成 了 JBoss Application Server， 如 图 24-8 Pr. 





Y Informatica PowerCenter 8.1.1 Cu 
INFORMATICA Application Server 


Choose the application server you want to use with Data 
Analyzer or Metadata Manager. The installation program 
installs JBoss Application Server version 4.0.3 by default. If 
you want to use WebLogic Server or WebSphere Application 
Server, you must install the application server before you 
install PowerCenter. 


nfig. ($ JBoss Application Server 


© Pralnsiallation sutrary 


© sialliny... 一 
© Doórnain Configuration O IBM WebSphere Application Server (Network Deployment) 


O BEA WebLogic Server 


© node conüguratian O IBM WebSphere Application Server (Base) 
Q9 nuinentication 
repository Confiquratiar 


© Posinsiallaiion Surra 





EIE mn 


24-8 Informatica PowerCenter 服务 器 选择 和 辣 导 
选择 默认 应 用 服务 右 ， 单 击 “Next” 投 钮 ， 进 入 下 一 流程 ， 如 图 24-9 Wr. 
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V Informatica PowerCenter 8.1.1 
INFORMATICA ss Application Server Directory 
Data Analyzer/h! etadata Manager Configuration 


© Install new JBoss Application Server 
O Use existing JBoss Application Server 


Choose the JBoss home directory: 





JBoss home: | D informaticatPowerCenterB.1.1WBoss403 | 





© Pre-Installation Suitiffrar 
[MITES UTD p Choose the JBoss Application Server configuration directory: 


© Dorrairt Confiquratien Configuration folder: verCenter8.1 1WBoss403'serverünformatica 
© node Soniiguraiion Restore Default 


© nuinentication 
24-9 [Informatica PowerCenter Jl 25-25-2252 [n] Sr 
系统 提示 是 创建 一 个 新 的 JBoss 应 用 服务 还 是 使 用 已 有 的 应 用 服务 , 然后 需要 给 出 JBoss 
的 安装 目录 和 JBoss 应 用 服务 的 配置 目录 。 选 择 完 之 后 单 击 “Next” 按 钮 ， 进 入 下 一 流程 ， 
如 图 24-10 所 示 。 








“i Informatica PowerCenter 8.1.1 (= | [Xx] 
INFORMATICA Pre-Installation Summary 


Review the following information before continuing. 


Product Name : 
Informatica PowerCenter 8.1.1 





Selected Components : 
PowerCenter Services 
PowerCenter Data Analyzer 
PowerCenter Metadata Manager 


NT TT | - gj Installation Directory : 
i - ps DAInformaticasPowerCentere.1.1 
© Dornain Confguratian 


© node Configuration Chosen Application Server : 
© ^uinentication JBoss Application Server 


Repository Conqguratiar : 
j j j [ : JBoss Home Directory: 
© Posirnsiallaiion Surnrmar : i 


installant hy Macrovision 


24-10 Informatica PowerCenter 服务 器 安装 预览 界面 
在 安 朔 预览 界面 ， 显 示 出 前 面 所 做 的 配置 信息 ， 如 果 需 要 修改 请 单 击 “Previous” 按 钮 返 


回 前 面 界面 进行 修改 ， 确 认 无 误 后 ， 单 击 “Next” 按 钮 开始 安装 Informatica PowerCenter 服务 
器 。 该 过 程 可 能 需要 几 分 钟 ， 请 读者 耐心 等 等 ， 如 图 24-11 Bran. 


BE ds CORDE PowerCenter 8.1.1 








INFORMATICA Installing PowerCenter 8.1.1 


Informaticas PowerCenter® 


全 全 全 四 全 二 四 和 和 四 四 四 四 
ls dMinifia- A : 5144 
gle i = 


© Dornain Confüguratien 


© Hode Cconüguratian 

© nuihentication 

© Repository Configuration 

© Posilnsiallaiion Surra Installing... Java Runtime Environment 


e hy Macrovision 





24-11 Informatica PowerCenter HRS 38 Z5 [n] 5x 
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安 北 完 成 之 后 ， 系 统 所 示 和 需要 创建 一 个 新 域 或 者 选择 连接 一 个 已 经 存在 的 域 ， 因 为 是 首 
次 安装 ， 所 以 选择 创建 一 个 新 域 ， 如 网 24-12 Pn. 


“ Informatica PowerCenter 8.1.1 a b4 


INFORMATICA Create or Join Domain 


© Create New Domain 


If you are installing PowerCenter Services for the first time or you 
wantto create a new domain. 


O Join Existing Domain 


If vou are installing PowerCenter on multiple machines and you 
have already created a domain on another machine. 


Help Me Select 


5 Hode Configuration Reminder: PowerCenter is licensed on a CPU basis. Consult your 
- lirpnsinn aareement far details nn vnur lirensed cnnfinuratinn 


Insralleniyemere ny Hacrovisian 








24-12 Informatica PowerCenter Jl 25-38 E] Js zz 286 [n] 5r 


接 下 来 需要 输入 连接 数据 库 服务 喜 的 配置 信息 , 用 来 保存 PowerCenter 域 配 置 元 数据 ， 如 
图 24-13 所 示 。 


S Informatica PowerCenter 8.1.1 - x 


INFORMATICA Configure Domain Database 


PowerCenter Services Configuration 


Enter the user account information for the database to store 
PowerCenter domain configuration metadata. You can store the 
PowerCenter domain configuration metadata and a PowerCenter 
repository in the same database user account. You must store 
configuration metadata for different domains in separate database 


Database type: Oracle 

Database URL: localhost:1521 

Database user ID: BI DOMAIN 
© node Confüguration Database user password: 


© suinentication Database service name: 


© Repositary Conüguration —Ó—À 


© PostInstallation Surnrriar; 


Installengsmere by Hacrovisian 


| Net) 
24-13 [Informatica PowerCenter 服务 器 的 域 数据 库 配 置 向 导 
然后 需要 输入 PowerCenter Services 配置 参数 ， 如 图 24-14 所 示 。 


| s x| 


INFORMATICA Configure Domain 






















PowerCenter Services Configuration 


Enter the information for the PowerCenter domain you want to 


~rantn 


Domain name: Informatica_Domain 
Domain host name: localhost 


Node name: localhost, Node01 


Domain port no: 
Domain user name: 
Domain password: 


Confirm password: 


© ^uinentication . "E . 
Note: A Repository Service is required for a Metadata Manager 


DEMZCIDES OT Cornñyuratie : : r 
© Repository Configuration installation and is created by default 


Q9 FPosiristallatior Su an | Advanced Confiquration | 









24-14 Informatica PowerCenter 服务 器 的 配置 域 问 导 
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随后 Informatica 为 服务 选择 一 个 计算 机 账号 进行 登录 ， 如 果 不 选 择 该 项 ，Informatica 的 
服务 log 将 创建 在 本 机 系统 当前 账号 下 ， 如 图 24-15 所 示 。 


“\ Informatica PowerCenter 8.1.1 


INFORMATICA Configure Informatica Services 


PowerCenter Services Configuration 


Enter the user name and password thatthe Informatica Services 
service uses to log on to the machine. Ifyou do not select this 
option, the Informatica Services service logs on with the Local 
System account (the user account currently logged in the machine). 


Select this option if vou want Informatica Services to run under a 


"n0SCFP—LI———— a 


C] Install Informatica Services with a different user account 


User name: VWAWW-CFB3BOSSSBCVAdministrator 
© rode Conguration Password: D] 


EE A^utrenticatior 
t hy Watr —— 
i iium " 


24-15 Informatica PowerCenter 服务 配置 问 导 
BE mi 4 7J PowerCenter 元 数据 知识 库 配 置 Repository 资源 ， 如 图 24-16 所 示 。 


“Informatica PowerCenter 8.1.1 


INFORMATICA nter Repository Configuration 





PowerCenter Repository for Metadata Manager 
© Create new PowerCenter repository 


O Use existing PowerCenter repository content 


Code page: MS Windows Simplified Chinese, supers... {v 
Database (pe: 
Database user ID: 


Database user password: 
Connect string: 


Reminder: PowerCenter metadata repositories are licensed on an 


utmienticatiar f A 
inctanra hacic 


enasitary Confidguratiari Test Connection 


E 
ma 
Postlrisiallatior Surrirriar 


ES e S Gs GC C GS GS GS GS 


SLM COLL EL DOLEO 


IE 0€ 
24-16 PowerCenter 元 数据 知识 库 配 置 癌 导 
接 下 来 需要 创建 PowerCenter 集成 服务 ， 并 选择 编码 格式 ， 如 图 24-17 Bran. 


“X Informatica PowerCenter 8.1.1 





INFORMATICA Er nfigure Integration Service 


PowerCenter Services Configuration 


Enter the name and data movement mode for the Integration 
Service. 


[v] Create Integration Service 


Service name : PowerCenter Integration Service 
User name: Administrator 
Password: [ee | 


Selectthe character data movement mode: 
O ASCII 


winernticatior © Unicode 


[ 
A^ 
m 
F? 


apository Conñguratiori Note: Integration Service is required for Metadata Manager 
installation and is created by default. 


Installengeshere 


Hep | [ Net | 
24-17 PowerCenter 集成 服务 配置 癌 导 
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A BU. RIEDER Is de A E — TIT] 238 27 Bs vt Us En ISTE TE CAT EA 2 PT 
RUPEE. XETEBUEE T GSL EIOS) rus tds "UE 24-18 PTR. 


X Informatica PowerCenter 8.1.1 b |» 


INFORMATICA 


(ON NN CECI E CENE 


®© FPosiInsiallatiorn Surra 


Installnseshere by Hacrovision 


ECCE NONE 





yzer Repository Configuration 
($) Create new Data Analyzer repository 
O Use existing Data Analyzer repository content 


Database type: Oracle ba 
Database URL: localhost:1521;SIDzorcl 


Database user ID: 





Database user password: 


[ Test Connection | 
[ we] 


24-18 PowerCenter 2/1354) Bras Wo E [n] A7 


IA RARER mi AE TE e 8S PO vt Us ecd T6] GER TETEB 70 S Y PER 
环境 。 选 择 创 建 一 个 新 的 元 数据 管理 器 资源 ， 如 网 24-19 Dra. 


S Informatica PowerCenter 8.1.1 












INFORMATICA 


iOCGGGGGeGeGeGece 


lag r Repository Configuration 


($) Create new Metadata Manager repository 





© Use existing Metadata Manager repository content 


Database type: Oracle | ba 


Database URL: Ilocalhost:1521;SID=orcl | 


Database user ID: Bl, METADATA 
Database user password: yxokokokookokolokokok 
Connect string: orcl 

















| Test Connection | 


24-19 PowerCenter 元 数据 管理 器 配置 癌 导 





最 后 ， 出 现 如 图 24-20 所 示 的 界面 ， 说 明 Informatica PowerCenter 服务 端 已 经 安装 成 功 。 


该 界面 显示 了 安 疙 服务 的 综合 信息 。 


EB E09 CRT M PowerCenter 8.1.1 


INFORMATICA 


LA 
NA 
* 
NA 
x 
.*/ 
NA 
A 
NA 
.*/ 
S7 
LY 
I 
LA 
~ 
K% 
.*/ 
x 
V 
v 
NA 
v 
NS 
© 


Installéngssmere by Macrovision 


ELM 





ter 8.1.1 Installation Summary 


Installation Status: SUCCESS 


Installation Status : SUCCESS ^ 
The PowerCenter 8.1.1 installation completed | : 
successfully. The information below summarizes the ll 
location and configuration of the installed products and — — 
components and status of the services. Use the debug 

log file 

D:/Informatica/PowerCenter8.1.1/Informatica Installation 
Server Debug log for more information. 


Installation Date : 
Thu May 31 08:17:11 CST 2007 


Product Name : 


ITE NNI 


24-20 PowerCenter 服务 端 安装 完成 界面 
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单 击 “Done” 按 钮 完成 安装 。 
登录 http://localhost:6001/adminconsole/Login.do， 如 图 24-21 所 示 。 


/, Informatica PowerCenter Adninistration Console — Windows Internet Explorer 





THE aED EO) kkaa IARD $8500 








— 8. 


e > Æ | http: //1ocalhost:5001/adminconsole/Login. do “|4| X| | 百度 





























3 d BIntomatics PowerCenter Administration Co... = 他 z dh z [p 页 面 Œ) ~ Q 工具 (Q) ~ Y 





Help About 


Informatica PowerCenter Administration Console 





Username: 











Password: 





[g €» Internet 


图 24-21 [Informatica PowerCenter 服务 端 登录 测试 界面 








以 admin/admin 登录 后 ， 进 入 Informatica PowerCenter 服务 器 管理 员 探 制 台 界面 ， 


24-22 所 示 。 


/, Informatica PowerCenter Administration Console — Windows Internet Explorer 


XFO REO SEV KERA IRAU  *88h0D 





























Go v |É|http://localhost:6001/adminconsole/Domains. do s*«|x| | 百度 和 
一 一 一 "^ » 

3 d | Æ Informatica PowerCenter Administration Co... | | ^ z D [en Y [sp 页面 Œ) ~ g 工具 上 @@) > 

Informatica PowerCenter Administration Console 和" Help About Logout 


























| Domain | Logs Administration Upgrade Manage Account 


Legend 


x B Details for domain: Informatica Domain EZE 


32 PowerCenter_Integration_Service Last updated:Es:[ z E 31 09:20:55 2007 
e PowerCenter 
Q License WWW-CF63B08936C 8356 











E PowerCenter 





Q Q Localhost Node01 


v v 





| 
7e PowerCenter_I... 








F @ Internet & 100% ~ FH 


图 24-22 Informatica PowerCenter 服务 器 管理 员 控 制 台 界面 





如 图 


在 域 控 制 台 ， 可 以 对 域 对 象 进行 省 理 ， 例 如 服务 (Services )、 市 点 《Nodes )、 序 列 与 


(Licenses) 和 网 格 (Grids)。 


24.1.3 Jm Le 


24.1.2 T Utfft [| Informatica PowerCenter 服务 器 的 安装 ， 本 节 将 介绍 Informatica 
PowerCenter XP mM] zb. HG Informatica PowerCenter 的 目录 ， 双 击 “installexe” 安 





闭 文 件 ， 弹 出 安装 界面 ， 如 图 24-23 所 示 。 
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Fẹ Informatica PowerCenter 8.1. 







INFORMATICA*9 


PowerCenter? 8.1.1 


Please select an option to install 


G Client 
© Reports 


Note: Before you continue, please read the 
PowerCenter Installation and Configuration Guide 


Documentation Center at http://my. informatica, com. 


Browse DVD -> 





INFORMATICA 
24-23 PowerCenter 安装 界面 
在 该 界面 中 ， 选 择 “Client” 和 选项， 系统 将 开始 Informatica PowerCenter 客户 端的 安装 ， 
如 图 24-24 所 示 。 


InstallÀnywhere 


Installánpwhere EER EREE. 





24-24 Informatica PowerCenter 的 准备 安装 界面 


随后 进入 Informatica PowerCenter 客户 端的 安装 欢迎 界面 ， 如 图 24-25 所 示 。 


XJ Informatica PowerCenter Client 8.1.1 


INFORMATICA Welcome 
.. Welcomi Welcome to Informatica PowerCenter Client 8.1.1. You can use this 

© installation Prerequisites wizard to install PowerCenter Client 8.1.1. 

© nei | Copyright © 1999-2008 Informatica C tion. AIl right d 
ES eei opyri F nformatica Corporation. All rights reserved. 
È Installation Direciory Pm PUn PS TRSISIY 
© Morada ME EU B] This wizard guides you through installation of Informatica 
EEE PowerCenter Client 8.1.1. Click Nextto startthe installation. Click 
'@® Insialling... Cancel at any time to stop the installation and exit the wizard. 


© Postinstallation Sürürrar, 





24-25 Informatica PowerCenter 客户 端的 安装 欢迎 界面 


接 下 来 进入 Informatica PowerCenter 客户 端 安装 的 系统 配置 要 求 界面 ， PowerCenter 客户 
冰 需 要 至 少 125MB 的 侯 扣 空间 ， 元 数据 管理 器 客户 问 需 要 710MB Bd. JAM 
户 端 的 安装 就 需要 至 少 835MB 的 磁盘 空间 ， 如 图 24-26 所 示 。 
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“i Tnformatica PowerCenter Client 8.1.1 


INFORMATICA 


Installation Prerequisites 


ESA Visio support: Microsoft.NET Framework 1.1 or later must be 
an Directory installed on the system: 

Parnagar 在 上 EE 

siallatior Suriras Disk Space Requirements PowerCenter Client: 125 MB 

1 , Metadata Manager Client: 710 MB 
TS Complete installation : 8335 MB 


? Post Installation erra! 





re hy Bacrovisian 


NT NN [res J 





24-26 [Informatica PowerCenter 2«J' 9m Z5) zs Scu EE SK EB 


接 下 来 选择 安装 方式 《有 完全 安装 、 目 定义 安装 两 种 安装 方式 )， 选 择 目 定义 安装 方式 ， 
如 图 24-27 所 示 。 


Wi TInformatica PowerCenter Client 8.1.1 


INFORMATICA 


© Complete 


Install PowerCenter Client, Metadata Manager Client 
(Metadata Manager Console and Custom Metadata 
Configurator, and ODBC drivers. 


Pyst-Insrallatior Sirra (9 Custom 


Choose the PowerCenter components to install. 


Installenyemere by Macrovision 


wm e] 
图 24-27 PowerCenter 安装 模式 界面 
然后 选择 要 安装 的 组 件 ， 建 议 初 学 者 全 都 选择 ， 如 网 24-28 所 示 。 


wi Informatica PowerCenter Client 8.1.1 


INFORMATICA 





Select the components to install: 


[v] PowerCenter Client 
[v] Metadata Manager Client 


Insiallprrenhere by C ES DR EE EDT E 


NEN [ewm JL ee ] 





24-28 PowerCenter 安装 组 件 问 导 
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系统 显示 Informatica PowerCenter 客户 端的 安装 路 径 ， 如 图 24-29 所 示 。 


“i Informatica PowerCenter Client 8.1.1 


INFORMATICA | Installation Directory 


Choose the installation directory : 


D:informatica'PowerCenter8.1 .1 | 
Restore Det 





© Post-Installation-&trrriar, 


LEESSESLL T EE TTE EC ES D ERE EST DO ET 


ECCE NN [ro iL tec ] 
24-29 PowerCenter 安装 日 录 问 导 
为 Metadata Manager 输入 集成 资源 库 的 名 称 以 及 Code Page 的 配置 参数 ， 如 图 24-30 PR. 








“J Informatica PowerCenter Client 8.1.1 


INFORMATICA dat er Client Configuration 


Enter the name ofthe PowerCenter repository and code page for 
Metadata Manager. The PowerCenter repository name and code 
page are required by the Custom Metadata Configurator. 


EZ fj | Integration Repository Name; PowerCenter 





© Installing... D Code Page: MS Windows Simplified Chinese, super... v. 
®© PostInstallation-&ürfirriar 


LEESESTL T EET TEE EC EST ELT ESTEE EO 


EH IN 
24-30 PowerCenter 元 数据 管理 器 配置 问 导 
接 独 系统 显示 安装 配置 信息 ， 如 网 24-31 所 示 。 


LI Informatica PowerCenter Client 8.1.1 | | x | 


INFORMATICA Pre-Installation Summary 





Review the following information before continuing. 


Product Name: 
PowerCenter Client 8.1.1 


Selected Components: 
PowerCenter Client 
y Metadata Manager Client 
LNSCN 7 
®© Poustinsialsriorreirrirrisy Installation Directory: 
| 7 D:Mnformatica«PowerCentera.1 .1 
Shortcut Folder: 
Start > Programs > Informatica PowerCenter 8.1.1 > 
Client 


Disk Space Information: 





24-31 PowerCenter 安装 设备 及 软件 要 求 癌 导 
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安 狠 成 功 之 后 ， 系 统 将 显示 所 有 安装 信息 ， 如 网 24-32 Bran. 


rd PowerCenter Client 8.1.1 


INFORMATICA 


Installation Status : WARNING 


Installation Status : WARNING 

The PowerCenter Client 8.1.1 installation completed 
successfully. The information below summarizes the 
lacation and configuration of the installed products and 
components. Although PowerCenter Client 8.1.1 has 

been successfully installed and configured, some of the 
services may not have been started. Use 

Dinf irmatica/PowerCenter8. 1.1/nformatica Installation - | 
Client Debug.log for more information. d 


LU 
NA 
v, 
bd 
y, 
v 
A 
T 
NA 
+, 
NA 
Lem 
I 


Installation Date : 
sun Nov 12 08:11:22 CST 2006 


Product Name : 


Installorrehere be Macrovision 


ET NLNN 
24-32 PowerCenter 安装 完成 状态 显示 


随后 可 选择 要 局 动 的 客户 端 工 具 ， 如 图 24-33 Br. 





LEE Informatica PowerCenter Client 8.1.1 


INFORMATICA J Installation Complete 


Successfully installed PowerCenter Client components. Select 
the applications to launch and click Done. 

Select applications to launch: 

[C] PowerCenter Designer 

C] PowerCenter Repository Manager 


[C] PowerCenter Workflow Manager 


C] PowerCenter Workflow Monitor 


C] PowerCenter Data Stencil 
[C] Metadata Manager Console 
C] Custom Metadata Configurator 


Installnysshere by acrist —9—— ———— ELE LES SEES EETÉEETTT]ZOI 


24-33 PowerCenter 安装 成 功 





单 击 “Done” 按 钮 ， 安 装 完 成 。 
242 ”Iniormatica PowerCenter 工具 的 一 般 使 用 流程 


对 于 初学 者 来 说 ，Informatica PowerCenter 的 工具 组 件 有 点 复杂 ， 比 较 容易 混 消 ， 接 下 来 
进行 简单 的 工具 使 用 流程 说 明 ， 如 图 24-34 所 示 。 
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启动 服务 引擎 Server 


定义 资源 库 Repository 


PowerCenter 
Designer 


工作 流 管 理 WorkFlow Manager 


监视 器 跟踪 Monitor Manager 





图 24-34 Informatica PowerCenter 工具 的 一 般 使 用 流程 


24.3 Informatica PowerCenter 快速 入 门 


通过 学 习 Informatica PowerCenter 的 安装 ， 读 者 对 Informatica PowerCenter 工具 有 了 人 简单 
的 认识 。 接 下 来 通过 一 个 快速 入 门 的 实例 来 加 深 读 者 对 Informatica PowerCenter 的 理解 。 


24.3.1 ”前 期 准备 
1) 创建 源 和 目标 数据 库 。 以 DBA 身份 登录 数据 库 ， 执 行 以 下 脚本 。 


create user BI SOURCE 
identified by "BI SOURCE" 
default tablespace BI ETL 
temporary tablespace TEMP 
profile DEFAULT; 
grant dba to BI SOURCE; 
grant unlimited tablespace to BI SOURCE; 
create user BI TARGET 
identified by "BI TARGET" 
default tablespace BI ETL 
temporary tablespace TEMP 
profile DEFAULT; 
grant dba to BI TARGET; 
grant unlimited tablespace to BI TARGET; 


2) 创建 源 数 据 库 表 结 构 。 连 接 到 数据 库 BI SOURCE， 执 行 以 下 脚本 。 


create table DEPT 

( 
DEPTNO NUMBER(2) not null, 
DNAME VARCHAR2(14), 
LOC VARCHAR2(13) 

); 

create table EMP 

( 
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EMPNO NUMBER(4) not null, 
ENAME VARCHAR2(10), 


JOB VARCHAR2(9), 
MGR NUMBER(4), 
HIREDATE DATE, 

SAL NUMBER(7,2), 


COMM NUMBER(7,2), 
DEPTNO NUMBER(2) 


» 
插入 以 下 数据 : 


insert into dept (deptno, dname, loc) values (10, 'ACCOUNTING', NEWYORK?); 
insert into dept (deptno, dname, loc) values (20, RESEARCH', DALLAS); 
insert into dept (deptno, dname, loc) values (30, 'SALES', CHICAGO); 
insert into dept (deptno, dname, loc) values (40, OPERATIONS', BOSTON?); 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7369, 

'SMITH', 

'"CLERK', 

7902, 

to date(1980-12-17', 'yyyy-mm- dd, 

800, 


20); 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7499, 
'ALLEN', 
'"SALESMAN', 
7698, 
to date(1981-2-20', 'yyyy-mm-dd^, 
1600, 
300, 
30); 
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7521. 
'WARD', 
'SALESMAN', 
7698, 
to date(1981-2-22', 'yyyy-mm-dd^, 
1250, 
500, 
30); 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7782, 
'"CLARK', 
'MANAGER', 
7839, 
to date(1981—-6-9', 'yyyy-mm- dd, 


commit; 


插入 源 数 据 后 显示 如 图 24-35 PTR o 


^? SQL Window - Query data of table EMPReORGE 





olx| ENS olx| 


SQL | Output | Statistics | SQL | Output | Statistics | 

select * from enp t select * from dept t 会 
* 
e 





ENAME | Loc —— | 
7363 SMITH CLERK 7302 1980-12-17 =. 800.00 10 ACCOUNTING. NEWYORK 
7499 ALLEN SALESMAN 7638 1981-2-20 = 1600.00 300.00 20 RESEARCH DALLAS 
7521 wARD SALESMAN 7638 1381-222 = 125000 500.00 | | 3 30 SALES CHICAGO 
7782 CLARK | MANAGER 7833 1981-6-9 = 2450.00 1 40 OPERATIONS. BOSTON 


wm Č [120 — [empnonumbe(4, mandatoy — — —— — — —  ;Z|wmO |] |4rowsselectedn0seconds 7 
24-35 定义 源 数 据 
3) 创建 目标 数据 库 表 结 构 。 连 接 到 数据 库 BI TARGET， 执 行 以 下 脚本 。 


create table TARGET 

( 
EMPNO NUMBER(4) not null, 
ENAME VARCHAR?2(10), 
JOB VARCHAR?2(9), 
MGR NUMBER(4), 
DEPTNO NUMBER(2), 
DNAME VARCHAR?2(14) 


); 
4) 在 Informatica PowerCenter Repository Manager 中 新 建 一 个 文件 夹 。 
首先 登录 Informatica PowerCenter Repository Manager， 如 图 24-36 所 示 。 


R Informatica PowerCenter Repository Manager = -lo|x| 
Repository Edit View Folder wersioning Security Analyze Tools Window Help 












— 8 
e B Rep 
o B wf 


Connect to Repository 
Connect to Repository 





24-36 [Informatica PowerCenter Repository Manager 登录 界面 
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wF "Folder" — “Create”, ld 24-37 所 示 。 


R Informatica PowerCenter Repository Manager = [Example] 


Edit.. - z 
Delete E xample 
P Compare... [Comments | Is Shared [Owner | 
E gu] 











图 24-37 创建 Folder 
在 弹出 的 界面 中 创建 Folder 对 话 框 ， 填 入 要 创建 的 目录 名 ， 如 图 24-38 所 示 。 





Create Folder 























图 24-38 “创建 Folder” 对 话 框 
创建 Folder 成 功 的 提示 信息 框 如 图 24-39 所 示 。 
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Example 


Administr... Administr... rwx 
Administr... Administr... rwx 





Repository Manager 


AJ 














24-39 创建 Folder 成 功 的 提示 信息 框 


打开 Informatica PowerCenter Designer 设计 器 并 登录 ， 如 图 24-40 所 示 。 


aA me > Q DIRE | | lv 


Repositories 


Me [310 en ter 8 Designer 


Setting the Standard for Enterprise Data Integration 


Getting Started Resource Center 
New Features and Enhancements Informatica.com 
mwy.informatica.com 


Developer Metwork 
Informatica Events 








Product Enhancement Request F 
Administrator 








Repository Folder Last Opened | 
PowerCenter AUDIT DM GC ETL3 11/03/11 
09:38 EF 
AUDIT SHARE Cw 08/281 
08:54 上 午 
Example Test 05/28/07 
10:51 EF 
PowerCenter AUDIT DM YX ETL3 05/27/07 
12:02 FF 
Example 05/27/07 
11:09 EF 





The Data Integration Co 





图 24-40 ”登录 Designer 7H 
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进入 后 双击 刚才 新 建 的 目录 “Test”， 如 图 24-41 所 示 。 








"uuu d 


(2 Targets 
Cubes 
Dimensions 
Transfor mations 
Mapplets 
Mappings 





24-41 Folder 展开 
到 目前 为 止 ， 前 期 工作 都 已 经 准备 好 ， 下 面 开始 快速 入 门 过 程 。 
24.3.0 ”定义 源 数 据 


在 Informatica PowerCenter Designer 设计 器 中 单 击 曙 按钮 ， 切 换 到 “Source Analyzer” 视 
KK], HR "Sources" — “Import from Database", 导入 源 数 据 ， 如 图 24-42 所 示 。 








| 加 Informatica PowerCenter Designer - [Source Analyzer - Test - [Example] 
E asi ; onir E 3-0urces. vyInaov 上 leip 





iocis a crear eee [E Import from Eile... 
" Import from Cobol File... 
Import XML Definition... 


Profiling 

Import From SAP... 

SAP Functions... 

Business Components Import from TIBCO Repository... 
Import From PeopleSoft ... 
Targets Import from Siebel ... 

Cubes ĉo Import from WSDL (Consumer)... 


B- & Example 
由 … f] example 


Dimensions Import from WSDL (Provider) ... 


Transformations 
Mapplets 
Mappings 


Import from PowerExchange... 
Import from Salesforce.com... 
=æ Create... 
% Edit... 


-p Compare... 
B] Preview Data... 














图 24-42 ”导入 源 数据 


弹出 “Import Tables ”对话 框 ， 如 图 24-43 Pp. 
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Import Tables 





Connect to Database 7 K 





x 
x | 
ODBC data source: [dBASE Files (Microsoft dBase Driver (*.dbf)) Sa gd 
Cancel | 
Username: | - 
Owner name: | Ta Hep | 
Connect 
Password: | 





Select tables 





Show owners: 


| Default 






Select all 





Select none 











24-43 "Import Tables" Xi 


Medzi, suus “ODBC 数据 源 管理 器 ”对 话 框 ， 如 图 24-44 所 示 。 


"ODBC 数据 源 管 理 露 
用 户 psy | 系统 DSN | 文件 psu | 驱动 程序 | 跟踪 ”| 连接 池 | 关于 | 


用 户 数 据 源 D: 
驱动 程序 | mmo... | 
Microsoft dBase Driver (x. dbf) 


Microsoft Excel Driver (*.xlsz) 
Oracle in ÜraDbiüg homel WIES R) | 


MS Access Database Microsoft Access Driver (*.mdb) " 
DECL Üracle in OraDbiOg_homel Bog C)... | 





24-44 ODBC 数据 源 管理 器 
创建 一 个 数据 源 ， 单 击 “ 添 加 ”按钮 ， 选 择 要 添加 的 数据 源 驱 动 ， 如 图 24-45 所 示 。 














Microsoft FoxPro YFP Driver (X. dbf) 
Microsoft ODBC for Oracle 
Microsoft Paradox Driver (*.db ) 
Microsoft Paradox-Treiber (*. db ) 
Microsoft Text Driver (X*.txt; *. csv) 
Microsoft Text-Treiber (*. txt; *. csv) 
Microsoft Visual FoxPro Driver 
Microsoft Visual FoxPro-Treiber 
Oracle in ÜraDbiÜüg homel 

SQL Server 


< lli | >| 











24-45 创建 新 数据 源 
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单 击 “ 完 成 ”按钮 ， 在 弹出 的 “Oracle ODBC Driver Configuration" (Oracle ODBC 4K35) 
配置 ) 对话 框 中 ， 输 入 源 数 据 库 配 置 参 数 ， 如 图 24-46 PR. 


Üracle ODBC Driver Configuration 


OK 
Data Source Name [orci p 
C | 
Description [rie Camel | 
Hel 
TNS Service Mame [oRcr -| Hep | 


Test Connection 
User ID [BS0URCE _Test Connection | 


Application | oracle | Workaroundsz | SülSerwver Migration | 


Enable Result Sets [wv Enable Query Timeoulw Read-Only Connectio| | 


Enable Closing Curso) Enable Thread Safet]M 


Bateh Autocommit Mode [Commit only if all statements succeed ”| 
Humeric Settings [use Dracle HLS settings "| 





24-46 ”输入 源 数据 配置 参数 


填 好 后 ， 单 击 “Test Connection” 按 钮 进行 测试 ， 如 图 24-47 所 示 。 


Oracle ODBC Driver Connect x | 


Service Hame 


us 


User Mame UK | 
ES SEI | 
Password 

ud About... | 


| 二 二 二 二 十 十 十 十 





24-47 建立 连接 


单 击 “OK” 按 钮 ， 弹 出 测试 成 功 提示 框 ， 如 图 24-48 Dra. 


Üracle ODBC Driver Configuration 


DK 
Data Source Mame [ere gcc 
C | 
Description [ire o Canc | 
Hel 
TNS Service Mame [oRcr | Hep | 


Test Connection 
Uzer ID [BI_S0URCE _Test Connection | 


Iesting Connection [x] 


Application | Oracle | Works 
Lonnection zucceszful 


Enable Result Sets [jw 
HE 
Enable Closing Curso 


Batch Autocommit Mode [Commit only if all statements succeed ”| 
Humeric Settings [use Dracle HS settings ”| 








24-48 测试 成 功 提 示 框 
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查看 ODBC AAU E I8 $3|onl-JW, ün 24-49 所 示 。 


BECOME ECT RE. kats 
用 户 ISH | X DSH | XF psy | 驱动 程序 | 跟踪 | 连接 池 | 关于 | 


Hege u): 
驱动 程序 Sh qo... | 


dBASE Files Microsoft dBase Driver (*.dbf) 
Excel Files Microsoft Excel Driver (*.xlz) HEE (EY | 
localhast Dracle in Ürallbilz hamel 


MS Access Database Microsoft Access Driver UÜ*.mdb] 
OECL Dracle in Ürallbilz hamel Rog: (C)... | 
orcl Dracle in Üralblüzg homel 























图 24-49 ODBC 数据 源 管理 器 


确定 后 ， 返 回 “Import Tables ”对 话 杠 ， 在 “ODBC data source” 下 拉 列 表 中 选中 刚刚 创 
建 好 的 数据 源 ， 如 图 24-50 所 示 。 





D Informati a PowerCenter Designer - [Source Analyzer - Test - [Example]] 


用 Repository Edit View Tools Layout ls Sources Window Help 二 | 可 | x| 


DR E1| 0 & » |s& aA] 昆 | i9 WERL 
ooo IEEE T EC 











9 Repositories 
E - & Example 
| — Be (2 example 
=e ;1 Test 
- (D Business Comp 


- (9 [eurces] 


pem Server IQ Demo (Adaptive Server IQ) 


E Targets dBASE Files (Microsoft Access dBASE Driver (*. dbf, a 
b (e Cubes o " Excel Files (Microsoft Excel Driver (*.xls, *.xlsx, * Zial 
iens (2 Dimensions | ; hci eli ee es Driver (*.mdb 
e EB Transformatior sjdw231 (Adaptive Server IQ) 
— (f Mapplets ; |sjedw96 (Adaptive Server IQ 
= (2 Mappings 
ie =] Rep 
— =] wf 


24-50 ”导入 数据 源 
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输入 用 户 及 密码 , 单 击 ″Re-connect” 按 钮 ， 在 下 方 选 中 要 导入 的 源 数 据 表 ， 再 单 击 ^“OK?” 
按钮 ， 如 图 24-51 所 示 。 


(P Test - [Example] X [Eu] ERG os 同 aL. zm hen 


o DO Iks 














Mappings 














© Start Page 52 
图 24-51 导入 源 数 据 表 
最 终 定义 好 的 数据 源 如 图 24-52 PZR. 


&3 Repositories 
日 … B Example 
: 由 ics (E examp le 


Ele 的 Test 
六 Business Components 




















EJ 多 orci 
: i d BONUS 
[S COUNTRY 
v» ER 
| Led vD IN 
L..V[b SALGRADE 
Lo (2 Targets 
b (D Cubes 
^ [B Dimensions 
e [f Transformations 
—— (B Mapplets tk (rcl llt HHÓN 
- (2 Mappings pe 











" 
" 
f 
M 
" 
A 
" 
A 
" 
» 
~ 
» 
了 
» 
A 
" 
» 
» 
» 
A 
" 
" 


» 








number (p, s) 
number (p, s) 











NTS 


Tr 


p — LE 
TT IA AII RAA IIIA IIA AIII II TEATIS, 





图 24-52 ”定义 好 的 数据 源 
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24.3.3 定义 目标 数据 


在 Informatica PowerCenter Designer 设计 器 中 单 击 bhk, EEG Targets Analyzer" %4 
EK], HR "Targets" — "Import from Database", 导入 目标 数据 ， 如 图 24-53 所 示 。 

















Import from File... 


Import XML Definition... | sü su sü sü i us T - [1 sa. 2 e Ed B E 
Import From SAP BW... 
Import TIBCO... 

35, Import from WSDL (Consumer)... 
Import from WSDL (Provider) ... 
Import from PowerExchange... 
Import from Salesforce.com... 

c» Create... 

£ Edit... 

-p! Compare... 

Bg. Preview Data... 

SALGRADE M Create/Edit Dimension... 

$$ Create Cube... 

a Edit Cube... 

a. Close Cube 


S" Generate/Execute SQL... 











Transformations 
Mapplets 
Mappings 








Ostet Page L 
24-53 ”导入 目标 数据 
其 创建 过 程 与 创建 源 数据 一 致 ， 在 这 里 不 再 详细 讲解 ， 如 图 24-54 所 示 。 


入 Repositories 
B- Bb Example 
H- ff example 
E Test 
(D Business Components 
Sources 


AE E GT 

SEE ; 

Dimensions ; | nunber (p, s) $ 

Transformations ; Yaches 1 
A : varchar? ; 

Mapplets 1 number (p, s) ; 

Mappings : number (p, s) $ 


varchar2 





























», 
L4 
-77T777T7TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTOZTTTTTTTTTOT 





24-54 ”目标 数据 工作 区 


24.3.4 ”定义 映射 规则 


在 Informatica PowerCenter Designer 设计 器 中 单 击 贸 按钮 ， 切 换 到 “Mapping Designer" 
视图 ， 在 “Repository Navigator” 中 ， 拖 动 源 数据 表 “DEPT” 和 “EMP” 到 右 侧 的 “Mapping 
Designer" fü, 94H "Mapping Name” 对 话 框 ， 如 图 24-55 所 示 。 
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B T 
日 8 Example 


— (f Business Components 
的 Sources 


| Mapp ing Name 


Dimensions 
Transformations 
Mapplets 
Mappings 














[D] a Page 
图 24-55 创建 映射 规则 


输入 映射 名 后 单 击 “OK” 按 钮 ， 这 样 源 数据 表 “DEPT” 和 “EMP” 束 显示 在 右 侧 了 ， 
接 痢 把 源 数 据 表 “DEPT” 和 “EMP” 以 及 目标 表 “TARGET” 拖 入 右 侧 ， 右 侧 视 图 最 终 如 图 
24-56 所 示 。 





z^ DEPT (Oracle) * 5Q DEPT 


Source Definition Source Qualifier 














Q | DEPTNO | | decimal 
| DNAME string 
| LOC | | 一 
| 
| | | 


























{Ü TARGET (Oracle) 
i Target Definition 











urce Definition Source Qualifier 


"TE EMP (Oracle) XE 














string 
string 
































图 24-56 ”映射 工作 区 


Thu, SAGTE “Mapping Designer” 视 图 中 单 击 鼠 标 左 键 ， 创 建 一 个 “Joiner” 的 
Transformation， 如 图 24-57 所 示 。 


307 








DEPTNü decimal 
DHAME string 
LOC (string 
































JNRTRANS 
Joiner 










































































图 24-57 创建 Joiner 的 Transformation 
将 图 24-64 中 左边 两 个 表 中 的 字段 均 拖 入 到 刚 创 建 的 “Joiner” 中 ， 然 后 将 “Joiner” 中 
的 “DEPTNO1” 和 “DEPTNO ”用 鼠标 选中 并 与 右 侧 的 Target 建立 连接 ， 最 终 效 果 如 网 24-58 
所 示 。 































































































图 24-58 ”映射 工作 区 效果 图 


接着 ， 双 击 “Joiner” 表 头 ， 在 弹出 的 对 话 框 中 选择 “Condition” 选 项 卡 ， 单 击 扶 
狐 建 关联 关系 ， 单 击 “ 确 定 ” 按 钮 ， 如 图 24-59 Bi. 


Edit Transformations 














图 24-59  Transformations 编辑 器 
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至 此 ， 映 射 规 则 定义 完成 。 最 终 效 果 如 图 24-60 Pr. 
请 干 万 不 要 忘记 保存 我 们 的 劳动 成 果 ! 











| decimal 
i string 
| 
| 














string 




















| Detail 
Detail 














Detail -— 

Master |P} 

Master | : 
Luc 



























































Output Window 


Parsing mapping m testl... 
... parsing completed with no errors. 


PEERKE Mapping m testi is VALID eebebokek 
mapping m testi inserted. 
mapping Examplel deleted. 





图 24-60 Designer 效果 图 
24.3.5 ”定义 工作 流 


085990 9 面板 中 的 加 按钮 ,打开 Informatica PowerCenter WorkFlow Manager 流程 设计 
器 ， 如 图 24-61 所 示 。 


W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example]] 
2 (Test [Example] ~ mal 100% v a | 图 
29] 0x|ew:ooloc 
@ Repositories 
J- Bb Example 


Ej PowerCenter. Integration, Service wdortflow De 
(2 example 














几 24-61 Informatica PowerCenter Workflow Manager 界面 
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Mo ere tu 面板 中 的 75989 按钮 , 在 工作 流 设计 视图 中 单 击 菜单 “Workflows” 


— “Wizard”, 如 图 24-62 所 示 。 











W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example] 





;| f Test - [Example] ~ T ecd 
&ogoexie:oolgjo 
B Repositories 
日 … Bb Example 


目 PowerCenter Integration Service 
(f example 


Start Workflow 
Recover Workflow 


(D worklets Dependencies... 
(2 workflows IE 











图 24-62 Workflow |n] 5: 


首先 ， 在 弹出 的 工作 流 创 建 导航 对 话 框 中 输入 要 创建 的 名 称 ， 然 后 单 击 “ 下 一 步 ” 按 钮 ， 
如 图 24-63 所 示 。 





Workflow Wizard - Workflow Name (Step 1 of 3) 


wf_testl| 





PowerCenter Integration Service v 





A | 





24-63 AX Workflow 名 称 


HR, HAMA m testl" WER, 添加 a 到 右 侧 的 “Sessions to be” 列 表 中 ， 单 击 “ 下 
一 步 ” 按 钮 ， 如 图 24-64 所 示 。 


310 


Workflow Wizard - Create Sessions (Step 2 of 3) 





EL 


select the mappings that you want to create sessions for. "e 
Use the arrows on the right to specify the order of the sessions in the workflow. w 





Select the mappings: Sessions to be c i. + + 


上 ERROR a session only rf the previous session completed 
ges cem 


€ E—5gT—6Éao | 取消 | wm | 
图 24-64 ”创建 会 话 


然后 ， 在 该 对 话 框 中 可 以 进行 抽取 周期 设置 。 比 如 ， 当 前 执行 、 某 天 某 时 执行 一 次 、 
天 晚上 执行 一 次 、 每 个 月 某 日 执行 一 次 等 。 在 这 里 选择 默认 方式 ， 即 立即 执行 方式 ， 然 后 单 
击 “ 下 一 步 ” 按 钮 ， 如 图 24-65 所 示 。 


-Schedule workflow (Step 3 of 3) 













Workflow Wizard 





Schedule Workflom 
Enter the scheduling information for this workflow. 


schedule Üptions: 
(* Run once 


Run Üüptions: 














lays Hours Mriruts: 


(^ Eun every 加 —] 


[^ Eun on demand 






[| Eun continuously 


End lptiaons: 


C Eni Ün [or 5-28 zs] 


C Forever 


Start options: 


Start [2007- 5-z8 [zl 


Start iios gi == 





















| 取消 | 帮助 | 
图 24-65 ”抽取 周期 设置 


最 后 ， 单 击 “ 完 成 ”按钮 ， 如 图 24-66 所 示 。 
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Workflow Wizard - Finish 
E 


Eun on demand 





图 24-66 Workflow 创建 完成 界面 


完成 后 ，Workflow Manager 管理 器 显示 如 图 24-67 所 示 。 





W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example]] 


(p Test - [Example] - E m 
Laez f 0a a] m e[ea i CO 8 3o 8 & 
6 Repositories 
B- 8 Example 


目 PowerCenter Integration Service 
(D example 


(D Tasks 


Worklets 
workflows 


Fetch Log 





图 24-67 Workflow Manager 管理 器 界面 
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接 下 来 ， 编 辑 关系 型 数据 库 连 接 。 单 击 9 25 9 LI 面板 中 的 四 按钮 ， 在 弹出 的 对 话 


框 中 单 击 “New” 按 钮 ， 如 图 24-68 所 示 。 
选择 数据 库 类 型 ， 如 图 24-69 PTR. 


W Relational Connection Browser — Po... [Xx | 


8 Relational Connection Browser 


Select Tvpe: Eliasz 


Objects: 


(IM Source 


MI warehouse Edit... 


MI wH Cann 
Delete | 


: Mew... : 


` beni E] 


Permissions... | 
COPY ÅS.. | 


Help | 
NEN 


Ed 


图 24-68 ”关系 型 数据 库 设 置 


输入 数据 库 连 接 源 信息 ， 如 图 24-70 所 示 。 











E Relational Connection Bro x| 


lg Relational Connection Browser 


— Select Subtype x| 


Sele 







PowercChannel Fer DBZ 
PowercChannel For MS SQL 5 
PowercChannel For ODBC 
PowercChannel Far Oracle 










awerchannel For Oracle Permissions... 


ower Channel Far MS SQL Server - 
+ (COE AS.. | 


图 24-69 ”选择 数据 库 类 型 


同样 ， 创 建 目标 数据 库 ， 最 终 效果 如 图 24-71 所 示 。 然 后 关闭 对 话 框 。 





Connection Object Definition E xi 


B Relational Connection Editor 


Mame: Bock OK 

Type: [orade L | Cancel | 
User Mame: BisourcE — Help | 
Password: [re 

Cannect String: bd 

Code Page: [ms windows Simplified Chinese, : ™ | 


attributes: 


| Attribute | LET E:T 
enp NR: 


E Lo 








图 24-70 ”输入 数据 库 连 接 源 信 息 





E Relational Connection Browser 


Select Tvpe: Close | 


Objects: 









SOURCE 
vbase 
nFarmix 
icrosoft SQL Server 
B2 


eradata Permissions... | 
awerChannel Far DBz d 
b Copy Bs... 
E: 


图 24-71 创建 目标 数据 库 











RAE “Workflow Designer” 视 图 中 双击 “Session” 按 钮 ， 弹 出 “Edit Tasks ”对 话 框 ， 


如 图 24-72 所 示 。 
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ial x| 


General | Properties | Config Object | Mapping | Components | Metadata Extensions | 





Select a 
Task type: Session [ Make reusabl 
Descripti: ^ 


Mapping m testl 
Resources | 


[ Fail parent if this task Treat the input links as: 
[ Fail parent if this task doe (* AND (C OR 


[ Disable this task 





m | mmo | wm | 





图 24-72 “Edit Tasks” 对 话 框 





选择 “Mapping” 选 项 卡 ， 单 击 左 侧 “S$Sources” 选 项 组 下 面 的 源 数据 表 ， 然 后 在 右 侧 的 
“ Connections” 下 单 击 到 按钮 ， 如 图 24-73 所 示 。 


Edit Tasks [D - [8| x| 


General | Froperties | Config Object Mapping | Conpenents | Metadata Extensions | 








Select task: eR Ss m testl 


Task type: Bession 000000 
各 Pushdown Optimization x Readers ——0000000000000000 
& Connections | Deve qnm MENT 
des db dus 


&à Files, Directories and Com 
B LJ Sources - 
$0 SQ DEPT 

SQ 5Q EMF Te EE 


日 LJ Targets Sh SQ DEPT 一 DB Connection 


日 LJ Transformations 


38 JMRTRANS - 
rovertics O Show Session Level Properties 
Attribute LERET - 


日 sü 5g DEPT 一 Source Qualifier 










şü 959 DEPT 






User Defined Join 


Humber Df Sorted Forts 





Tracing Level Hormal | 


"Tnm. | Brarti... | < Please pick a connection 之 


p | mico | am | 


[lk 24-73 Connections 设置 





在 弹出 的 对 话 框 中 选择 “SOURCE” 如 图 24-74 所 示 。 
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il Relational Connection Browser EZ xj 








Q Start Page 

€ Pushdown Optimization 
€ Connections 

€ Memory Properties 

€ Files, Directories and Com 








日 Lg Transformations 
39 JNRTRANS 














图 24-74 ”关系 型 数据 库 设置 
单 击 “ 确 定 ” 按 钮 后 显示 如 图 24-75 所 示 。 





$0 59 DEPT 一 DB Connection 
Relational SOURCE 


24-75 ”数据 库 连 接 


同样 ， 在 “Targets” 选 项 组 中 将 其 选 为 目标 数据 库 ， 并 且 在 “Properties” 属 性 中 设置 参 
数 ， 如 图 24-76 所 示 。 


Edit Tasks 





N 








Q Start Page m_testl. TARGET 
Q Pushdown Optimization || z TOTP 


Q9 Connections | 和 | Writers 
Gi 
Files, Directories and Com 
日 LJ Sources 
SA 5Q DEPT 





Connections 
S] TARGET mbedil O NT | 
& LJ Transformations Type [Re 

» MRRAN 





Properties 


Attribute 
TAECET 一 Relational Writer 


Target load type 


Update as Update 
Update as Insert 





Update else Insert 


< Please pick a connection > 








24-76 Properties 设置 
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至 此 , 工作 流 部 分 设置 完成 。 在 Informatica PowerCenter Workflow Manager 设置 器 中 单 击 


3#. “Repository” —> “Save”. 
24.3.6 ”局 动 工作 流程 
方法 一 : 在 “Worflow Designer” 视 图 的 空白 位 置 单 击 女 标 右键 ， 在 弹出 的 快捷 采 单 中 选 


择 “Start Workflow” 命 令 。 

方法 二 : dqp4 4 ?* 面板 中 单 击 宇 按钮 。 

局 动 后 ，Informatica 将 目 动 打开 工具 PowerCenter Workflow Monitor， 如 果 看 到 
“Succeeded” FFF, Mji HH CEEA SIKI, UA 24-77 Bras. 


M Informatica PowerCenter Workflow Monitor 
Repository Edit view Tools Task Filters Help 


LITPT. «mi s n| y- i x s|*83 


| 


Repositories 
a-e Example 

: SE PowerCenter Integration Service 01:09:08 Connected 

Bm. Test 

日 -入 w£ testi 00:00:02 | Succeeded 

-ke 00:00:02 | Succeeded 




















Gantt Chart 


Properties 


s m testi [2007-5-28 11:50:05] 

Y Task Details 

Attribute Name Attribute Value ^ 
Instance Name s m testl 到 | 
Task Type Session 

Integration Service Hame PowerCenter Integration Service 

Hode (s) node01 20100T29-1030 

Start Tima 2007-5-24 11-560 n8 

hA Source/Target Statistics 


Transformation Hame Node | Applied Rows | Affected Rows Throughput (Rows/Sec) Last Error ... | Last Error ^ 


E- SA SQ EMP 
¿SA Partition #1 | nodeDl 2... 
Œ- $] TARGET 


L Partition Details 








lai Performance 


Output Window 





24-77 PowerCenter Workflow Monitor 界面 


使 用 “BI TARGET” 用户 各 登录 PL/SQL Developer 工具 ， 碍 询 目 标 表 数据 后 ， 显 示 如 图 
24-78 所 示 《 有 蛛 来 该 表 中 数据 为 空 ， 现 搬入 4 条 数据 )。 
= SQL Window - Query data of table TARGET«GORCL 17 - lal x| 


SQL | Output | Statistics | 


elect * from target t 





7782 CLARK MANAGER 7839 10 ACCOUNTING 
7369 SMITH CLERK 7902 20 RESEARCH 


7521 WARD SALESMAN 7698 30 SALES 
7499 ALLEN SALESMAN, 7698 30 SALES 





z- uU 11 [4 rows selected in 0 seconds A 
24-78 目标 数据 
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下 面 给 出 一 个 直观 的 数据 图 ， 以 便 大 家 学 习 。 其 中 ， 图 中 上 半 部 分 两 个 表 为 BI SOURCE 
源 数据 库 中 表 ， 下 半 部 分 为 经 过 ETL 处 理 之 后 ，BI TARGET 目标 数据 库 中 表 中 的 记录 ， 如 


图 24-79 所 示 。 





SQL | Output | Statistics | 








ini x| 





© 


”SQL Window - Query data of t 
SQL | Output | Statistics | 





inl x| 


i * from emp t 


* * 
ri Dic] 
Emi E 














i * from dept t 
j - 


<u 





v | C = $4 Zl. 
R 

















(4 rows selecte 


10 ACCOUNTING. NEWYORK m 7353 SMITH CLERK 7902 1980-12-17 =. 800.00 20 
20 RESEARCH DALLAS DE 7499 ALLEN SALESMAN 7698 1981-2-20 = 1600.00 300.00 30 
30 SALES CHICAGO | | 3 7521 wARD SALESMAN 7538 1981-2-22 - 1250.00 500.00 30 
40 OPERATIONS BOSTON BE 7782 CLARK MANAGER 7833 1981-6-9  * 2450.00 10 





SüL | Output | Statistics | 










Ini x| 








hd 
ic] 
= 








select * from target t 
" 
SZ $ T 
















244 本 章 小 结 


— © 11 4 rows selected in 0 seconds A 





10 ACCOUNTING 
20 RESEARCH 

30 SALES 
30 SALES 







MANAGER 
CLERK 

SALESMAN 
SALESMAN 


7782 CLARK 
7369 SMITH 
7521 WARD 
7499 ALLEN 






7698 











图 24-79 经 过 ETL 处 理 的 源 数据 和 目标 数据 





1) Informatica PowerCenter 的 安装 分 为 : 服务 器 安装 、 客 户 端 安装 。 
2) 在 Informatica PowerCenter 服务 噩 的 安 闭 过 程 中 ， 需 要 提前 创建 以 下 4 AXE: 


数据 分 析 库 : 


3) 在 域 控 制 从 ， 








存储 在 数据 分 析 过 程 中 产生 的 数据 参数 指标 。 


元 数据 管理 库 : 在 设计 过 程 中 产生 的 一 系列 数据 及 参数 指标 均 保存 在 该 数据 库 中 。 
域 配置 数据 库 : 存储 域 配置 过 程 中 的 参数 指标 。 





可 以 对 域 对 象 进行 管理 ， 例 如 服务 CServices). zi (Nodes). FA y 


(Licenses) 和 网 格 (Grids). 
4) Informatica PowerCenter 的 一 般 开 发 流程 为 : 启动 服 务 引 | 擎 一 定义 资源 库 一 数据 抽取 


流程 设计 一 工作 流 管 








理 一 监视 跟 踩 。 


5) 启动 工作 流程 。 
方法 一 : 在 “Worflow Designer” 视 图 的 空白 位 置 单 击 忌 标 右 键 ， 在 弹出 的 快捷 逐 单 中 选 


F% “Start Workflow” 








P 
命令 。 


方法 二 : E4 e 099?* 面板 中 单 击 量 按钮 。 
启动 后 ，Informatica 将 目 动 打开 工具 PowerCenter Workflow Monitor， 如果 看 到 


“Succeeded” 字 样 ， 


则 说 明 工 作 流 程 局 动 成 功 。 
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6) Informatica PowerCenter 的 安装 过 程 包 括 : 

e 创建 源 和 目标 数据 库 。 以 DBA 身份 登录 数据 库 ， 执 行 脚本 。 

e 创建 源 数据 库 表 结 构 。 连 接 到 数据 库 。 

e 创建 目标 数据 库 表 结构 。 

© 在 Informatica PowerCenter Repository Manager 中 新 建 一 个 文件 夹 。 

e 在 Informatica PowerCenter Designer 设计 器 中 单 击 加 按钮 ， 切 换 到 “Source Analyzer" 
AME], HRK "Sources" — “Import from Database", 55A YR AE o 

e 在 Informatica PowerCenter Designer 设计 器 中 单 击 山 按钮， 切换 到 “Targets Analyzer" 
AME], HR "Targets" — “Import from Database”， 导 入 目标 数据 。 

€ 在 Informatica PowerCenter Designer 设计 器 中 单 击 肋 按钮 ， 切 换 到 “ Mapping 
Designer” 视 图 ， 在 Repository Navigator 中 ， 拖 动 源 数 据 表 “DEPT” 和 “EMP” 
到 右 侧 的 “Mapping Designer” 视 图 。 

e iuis LE. 
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"B25Z9* Informatica 实例 


本 章 目标 

第 24 EITHA T Informatica 的 安装 及 快速 入 门 ,本 章 将 通过 绥 慢 变化 维 的 几 种 解决 方式 来 
进一步 介绍 Informatica 工具 。 

学 习 本 章 后 ， 您 将 掌握 : 

e 2x TI 

e 绥 慢 变化 维 的 实现 方式 。 


294 缓慢 变化 维 的 概念 





在 现实 世界 中 ， 维 度 的 属性 会 随时 间 的 流逝 而 发 生 缓 慢 的 变化 。 将 发 生变 化 的 维度 称 作 
“ 绥 慢 变化 维 ”， 它 是 一 种 ETL 对 数据 仓库 维度 表 的 更 新 技术 。 举 例如 下 : 

在 销售 行业 的 数据 仓库 中 ， 如 果 某 销售 人 员 从 A 地 区 调 到 B 地 区 ， 那 在 统计 这 名 销售 人 
员 的 销售 记录 和 销售 业绩 时 ， 在 调 离 前 应 该 算 在 A 地 区 的 销售 记录 ， 调 离 后 应 该 算 在 B 地 区 
的 销售 记录 。 如 何 处 理 这 名 销售 人 员 所 属 区 域 的 变化 ? 这 就 是 研究 绥 慢 变化 维 的 原因 。 

在 数据 仓库 中 ， 事 实 表 的 设计 通常 包含 多 个 代理 主键 ， 周 围 环 绕 大 多 个 维 表 ， 当 维 表 的 
数据 发 生变 化 时 ， 数 据 仓库 需要 立刻 友 现 这 种 维度 的 变化 。 下 和 面 用 Informatica PowerCenter 
工具 去 实现 绥 慢 变化 维 的 多 种 解决 方案 。 


29.2 ”缓慢 变化 维 的 实现 方式 


252. ”覆盖 方式 


源 表 : src dxpcode. 
表 结 构 如 图 25-1 所 示 。 


FAS vaco | 
Pme nize y — | — [| —— 
































图 25-] src dxpcode 表 结 构 
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数据 如 图 25-2 所 示 。 


CODE | NANE  TBNANE|PENANE ADDID [AUDBLOB |TTFE [CODELYL 


i 


BxrR — eo p p pg gg n —— 
sse Qm m b o a E — 
33020 | 进展 情况 erag EY D D —hn a0 ——— 
33021 WARE: [sores Tsuksc D — D —— 0 d ——— 





图 2$-2 src dxpcode 表 数 据 


HERK: newtarget0。 
表 结 构 如 图 25-3 所 示 。 
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Pm Pema meea | | 





图 25-3 newtarget0 表 结 构 


步骤 1: 在 绥 慑 变化 维 癌 导 中 选择 Slowly Changing Dimensions (HERE) 命令 ， 如 
图 25-4 所 示 。 


d Getting Started... | 
slowly Changing Dimensions 





i Debugger S E 
图 25-4 SEE HESSE 


步骤 2: 选择 “Type 1 Dimension” 单 选 按钮 ， 如 图 25-5 所 示 。 


m slowlyChanginglemo | 





图 25-5 “模式 ”对 话 框 
步骤 3: 选择 源 表 和 日 标 表 ， 如 图 25-6 所 示 。 


orcl:SRC, DXPCODE | 


HEWT ARGETO | 





图 25-6 ”选择 源 表 和 目标 表 


步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
需要 对 比 的 字段 ， 如 图 25-7 所 示 。 
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图 25-7 选择 器 


步骤 5$: 生成 标准 的 履 兰 型 的 缓慢 变化 维 Mapping， 如 图 25-8 所 示 。 


SEQ Generatek 


ers 


LKP GCetData 


K E 


SRC DXPCODE ( SQ SRC DXPCOD 
Oracle) E 


je 


EXP DetectCha FIL InsertNew 
nges Record 


FIL_UpdateCha 
ngedRecord 


图 2$-8 ”映射 工作 区 
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UPFD Forcelnse NEWTARCETO (0 
rts racle) 


f 7 


UPD_ChangedUp HERTARGETOI ( 
date Oracle) 





整个 Mapping 分 成 两 个 部 分 : DAEA A E A uB 25-9 所 示 。 


SEC DXPCODE ( SQ SEC DXPCOD LIP GetData 
Oracle) E 


2 


EXP DetectCha 


|'IL UpdateCha 
ipo dKacor 


图 25-9 映射 工作 区 的 数据 区 


ChangedFlag: 用 于 判断 数据 发 生 改 变 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 学 段 值 时 ， 其 值 为 “true” 该 Mapping 执行 更 狐 数据 的 操作 ; TUN “false”, 


不 执行 更 新 操作 ， 如 图 25-10 所 示 。 


了 22 





VPD Changi:: p 
date 


ETTARPETO (i( 
racle) 


A 


"A PE 
CEPTI 





IIF(NOT ISHULL (PM PRIMARYKEY) a 
AND 

( 

DECODE (ADDBLOB, PM PREV ADDBLOE, 1, 0) 
OR 

DECODE (ADDID,PM PREV ADDID,1,0) = D 
OR 

DECODE (CODELVL, PM PREV CODELVL, 1,0) = 
OR 

DECODE (NAME, PM PREV NAME, 1,0) = O 

OR 

DECODE (PKNAME, PM PREV PKNAME, 1,0) = 0 
OR 

DECODE/TBNAME,PM PREV TBNAME, 1,0) = 
OR 

DECODE(/TYPE,PM PREV TYPE,1,0) = 0 
?, TRUE, FALSE) 


M 
e 


| 
e 


| 
ce 


图 2$-10 ”代码 片段 


NewFlag: 用 于 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 果 目 标 表 中 不 存在 该 数据 ， 则 其 
EN “true”, iz Mapping 执行 插入 新 数据 的 操作 ; 否则 为 “false”， 不 执行 插入 操作 。 
IIF(ISNULL(PM PRIMARYKEY),TRUE,FALSE) 
第 一 次 执行 该 Mapping I, HERK MŽ un 25-11 Przs. 

































































PH PRINARTKEI CODE | NANE [TBHANE PENANE ADDID ADDBLOB TYPE CODELVL. 
so — [ao MTM sc lsc fpo p n nh —-— 
51 33047 [RAFI QK ak p 0 e f 
52 33048 | 期 刊 素材 — [sc SC fr 0 n [t 
53 33049 [RAFI QK gk i 0 e f 
54 —— po 和 ë uk w p bp P? h 
55 — posi HASSA zy TI o po n h - 
56 — Baoni[EheB Eu fa o PP n h - 
57 —  [s3008 方案 gray pra pb PP —— 
58 33009 | 过 程 MI ey p 0 e f 
59 33002 [tit [AKTI BE fo 1 maa 
leo 33003 [it FI] TI p 0 "n hl 
B1 — [3004 BEiFBRÉR [DETAIL [DETAIL o p | Bož 
e2  (Bao0|Bi& pzs pzs o D n à —— 
B4 33007 AAWE — (GBTXL [GBTXL |! 0 B f 
65 33010 | 设置 SET — EET f 0 e f 
[e6 33011 | 索引 INDEX [INDEX fi 0 B f 
eT = Po 时 划 [m m bp gp e gp 
Bp — pasim ë uk lax p P Pg à -— 
Bee pos Æa ke ke p Ro n h o 





目标 表 的 数据 
总 结 : 履 广 方式 古 绥 慢 变化 维 中 相对 人 简单 的 一 种 方法 。 其 特点 是 保证 数据 仓库 中 的 数据 


图 25-11 





始终 是 最 新 的 ， 不 保留 历 史 数 据 。 如 果 发 现 新 数据 ， 则 将 新 数据 加 载 到 目标 表 中 。 如 来 数据 
发 生 改 变 ， 则 执行 更 新 操作 。 
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2522 全 历史 记录 


源 表 : src dxpcode. 
表 结 构 如 图 25-12 所 示 。 


memme WAR | 
pum aware OO [| —— 


图 25-12 src dxpcode 表 结 构 





数据 如 图 25-13 所 示 。 


[CODE | HANE  TBNANE PENNE [ADDID [ADDBLOB [TTFE |CODELVI. 





图 25-13 src dxpcode 表 数 据 


目标 表 : newtargetl. 
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表 结 构 如 图 25-14 所 示 。 


i wo | —— | —— [o 
i wo | o [o —— 


图 25-14 newtargetl 表 结 构 


=| =] =] 





步骤 1: 在 绥 慢 变化 维 辣 导 中 ， 选 择 “Slowly Changing Dimensions( 绥 慢 变 化 维 )” 命 令 ， 
如 图 25-15 所 示 。 


| Wizards Getting Started... 
Debugger d Slowly Changing Dimensions... 


图 25-15 REAME E 





步骤 2: 选择 “Type 2 Dimension” 单 选 按钮 ， 如 图 25-16 所 示 。 


New Mapping name: 


[n _fullhi storychanges| 


Type 





C Type 1 Dimension - keep most recent values in targ 


(* Type 2 Dimension - keep a full history of changes in the 


C Type 3 Dimension - keep the current and previous values in the 


dS 取消 帮助 | 
图 25-16 模式 向 导 


步骤 3: 选择 源 表 和 目标 表 ， 如 图 25-17 所 示 。 
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orcl:SRC DXPCODE Bl 


HEWTARGET1| | 





图 25-17 源 表 和 目标 表 


步骤 4: "Logical Key Fields” 是 选择 唯一 确定 数据 的 关键 字段 ,“Fields to compare for" 
古 选择 需要 对 比 的 字段 ， 如 图 25-18 所 示 。 





图 25-18 ”选择 器 
步骤 S: 生成 标准 的 全 历史 记录 型 版 本 与 绥 慢 变化 维 Mapping, WA 25-19 所 示 。 


«t. 2 (T? ) 
1 "f 


SEQ Ceneratek EXP KeryProces 
ers 


sing InsertNe 


w 
SRC DXPCODE 【 SQ SRC DXPCOD LEP GetData 
Oracle) E 


1 Lai L3 ^ i 
20 j 4f 
«E 
j <$ 
EXP DetectCha FIL InsertNew UFDN Forcelnse NEWTARGCETi1 (0 
nges Record rts racle) 
" 27 ji 
"f 
r AA 
Ll 
FIL InsertCha UFD ChangedlIn EXP KerProces 


ngedRecord serts sing InsertCh 


anged 


L 


NEWTARCETi11 ( 


Dracle) 





图 25-19 ”映射 工作 区 
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整个 Mapping 分 成 两 个 部 分 : 者 数据 的 插入 和 将 旧 数 据 的 每 次 变化 插入 到 目标 表 中 ， 如 
图 25-20 所 示 。 


SEQ (enaratek EXP AerTrocez 


PLI FT 


i ol 6; 


the DXFOODE [ sq EAC BXFOOD LKP Gatbata 
Üriclal E 


T : 


EKF DeieciCha FL Ter VID Forcelnza 
EIL Racord riz 


f 了 


FIL InzertChá LpNS LAE EXF LérProces 
npedEecord zxariz sinp Inzertch 
TT. 


WENTAMCETI1 ( 
[nb 





图 25-20 ”映射 工作 区 的 数据 区 
ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 “true”， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目 
标 表 中 的 操作 ， 如 图 25-21 所 示 。 


ITF ‘NOT ISHULL (PM PRINMARYKEY) 


AND 

i 

DECODE (ADDBLOB, PM PREY ADDBLOB, 1,0) = 0 
JF. 

DECODE tADDID, FM_PREV_ADDID, 1,0) = 0 

JF. 

DECODE i(CODELVL,PM PREV CODELVL, 1,0) = 0 
JR 

DECODE (NAME, PM_FREV_NAME, 1, 0) = 0 

JF. 

DECODE iPENAME,PM PREY PENAME, 1,0) = 0 
JF. 

DECODEiTBNAME,PM PREY TBNAME, 1,0) = 0 
JF. 


DECODE (TYPE, PM_FREV_TYFE, 1, 0) = 0 
l, TRUE, FALSE) 


图 25-21 代码 片段 
NewFlag: 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 果 目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, 1% Mapping 执行 插入 痢 数 据 的 操作 ; 否则 为 “false”， 不 做 插入 操作 。 


IIFISNULL(PM PRIMARYKEY),TRUE,FALSE) 
当 第 一 次 执行 该 Mapping 时 ， 目 标 表 的 数据 如 图 25-22 所 示 。 
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ee era oun ears s mc 


-— —- 


图 25-22 ”目标 表 数 据 


总 结 : 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 发 现 源 表 中 的 
旧 数 据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作 为 新 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 
并 赋予 新 的 代理 主键 值 。 如 采 源 表 中 友 现 新 数据 ， 则 直接 插 入 到 目标 表 中 。 其 中 版 本 号 是 递 
增 记录 的 标识 ， 版 本 写 最 大 的 古 最 独 的 记录 。 


25.2.3 ”标记 位 方式 


源 表 : src dxpcode. 
表 结 构 如 图 25-23 所 示 。 


图 25-23 src dxpcode 表 结 构 




















数据 如 图 25-24 所 示 。 
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CODE | HANE (TENANE PENANE [ADDID [ADDBLOE |TTFE [CODELYL. 
bod 
[oH 


| 


| 


i 


33019 Ei [HFE [HIFK 


一 
B og — 





图 25-24 src dxpcode 表 数 据 


目标 表 结 构 : newtarget2. 
表 结 构 如 图 25-25 所 示 。 


Rd Wo —— | —— | — | o —— 
FRIOWGENT FLAG meer Go | | | o 


图 25-25 newtarget2 表 结 构 


i e| e| re 





步骤 1: 在 绥 慢 变化 维 辣 导 中 ， 选 择 “Slowly Changing Dimensions (ZERE) Me, 
如 图 25-26 所 示 o 
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| Wizards Getting Started... 
Debugger Slowly Changing Dimensions... 


K| 25-26 绥 慢 变化 维 向 导 





步骤 2: 选择 “Type 2 Dimension” 单 选 按钮 ， 如 图 25-27 Pr. 


Hew Mapping name: 


[n £ullhisterychanges 1 


Type 





(^ Type 1 Dimension - keep most recent values in targı 


Ù Type 3 Dimension - keep the current and previous values in the 


< E m T—£ 7| 取消 | a | 
K|25-27 Xu 


步骤 3: 选择 源 表 和 目标 表 ， 如 图 25-28 所 示 。 
^V UK 4: "Logical Key Fields” 是 选择 唯一 确定 数据 的 关键 字段 ,“Fields to compare for" 
征 选 择 需 要 对 比 的 字段 ， 如 图 25-29 Brzn. 





Select Source Table 
[za :SRC DXPCODE m | 


Target Table Fields Logical Key Fields 


CODE 
New Target Table Add >> | 
吓 wTARGET3 
<< Remove | 


Fields to compare for 





: : ADDBLOÜB ^ 
i ; ADDID 
EU CODELVL 
emove | NAME 
PKNAME | 








< 上 一 步 @) [ T—:5 00 >] 取消 帮助 | 《上 一 步 @) | 下 一 步 中 ?| mi | 帮助 | 








图 25-28 源 表 和 目标 表 图 25-29 ”选择 器 
步骤 $: 生成 标准 的 全 历史 记录 型 标记 位 方式 绥 慢 变化 维 Mapping. "ld 25-30 IZR. 
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SEQ GCeneratek 


ers 


SQ SRC DXPCOD LKP GetData 


E 


整个 Mapping 分 成 3 个 部 分 : 


据 标 志 为 0， 如 图 25-31 所 示 。 


SEC DXFCODE | 
GITEN 


WEE 


SEQ Cenarat*ek 
eT 


E 


sg SNC DXPCOD 
r 


97 
e 


LKF CeiData 


图 25-31 


ETT 
T 


EXP KerProces 
sing_InsertHe 
w 


MENR: 
Y 


EXP DetectCha 


nges 


FIL InsertNew 
Record 


A 


FIL_InsertCha 
ngedRecord 


FIL, UpdateCha 
ngedRecord 


图 25-30 ”映射 工作 区 


狐 数 据 的 搬入、 插入 修改 后 的 数据 并 且 标 志 为 1、 将 旧 数 


T 


EXF Karfrocet 
sing Inszerila 
LI 


EXF DaetectCli 
nges 


FIL IżzėriChi 
ngeedhecord 


FIL UpdateCta 
HTIDL ETE! 


v 
A 
UFD ForceInse 

rts 

Lal 

A 
UFD ChaneedlIn 
serts 


Ls 
d 
UPD_ChangedUp 
date 


UPD Me CT ET E ES 
sert 


lud _Changediip 
daté 


映射 工作 区 的 数据 区 


NETIAREET2 (0 
racle) 


T 


j 


EXP KerzProces 
sing InsertCh 
anged 


NEWTARCET21 Í 
Oracle) 


ni 
a f j 
gd 


EXP KeyProces 
sing UpdateCh 
anged 


NEWTARCET22 Í 
Oracle) 





eT, 
l 
EXP KasFrocas 
sing_inseriCh 
"tS LI 


EE 


HERTAPGET21 


Drecla) 


T 
I 
EXP KarTrocez 


E300 EU AE MO 


anrad 


2$ 


NERTARGET22 ( 


Öraciel 
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ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 “true” iz Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目标 
表 中 的 操作 ， 如 图 25-32 所 示 。 


ILIF(NOT ISNULL (PM PRIMARTKET) 
AND 

(PM CURRENT FLàG = 1) 

AND 














( 
DECODE (ADDBLOB,PM PREV ADDBLOB, 1,0) = 0 


DK 

DECODE (ADDID,PM PREV ADDID,1,0) = 0 
JR 

DECODE (CODELVL,PN PREV CODELVL, 1,0) = 0 
DK 

DECODE (NAME, PM PREYV NAME, 1,0) = O 

OF 

DECODE (PKNAME,PM PREV PKNAME, 1,0) = 0 
DK 

DECODE(TBNAME,PNM PREY TBNAME, 1,0) = 0 
JR 


DECODE (TYPE, PM_PREV_TYPE, 1, 01 = O 
Ja TRUE, FALSE) 


图 25-32 ”代码 片段 


NewFlag: 判断 该 数据 是 人 否 为 新 数据 的 标识 字段 。 如 果 目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, i% Mapping 执行 插入 新 数据 的 操作 ; 否则 为 “false”， 不 做 插入 操作 。 
IIFISNULL(PM PRIMARYKEY),TRUE,FALSE) 


当 第 一 次 执行 该 Mapping 时 ， 目 标 表 的 数据 如 图 25-33 所 示 。 


PE FEINAETKET CODE | HANE  TBEANE FENANE [ADDID [AUDBLOB (TYPE |CODELYL PE CURRENT FLAG 





图 25-33 ”目标 表 数 据 
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总 结 : 全 历史 记录 方式 是 缓慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 发 现 源 表 中 的 
旧 数 据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作 为 新 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 
并 赋予 新 的 代理 主键 值 。 如 采 源 表 中 发 现 新 数据 ， 则 直接 插入 到 目标 表 中 。 标 记 位 方式 是 其 
中 的 一 种 ， 主 要 包括 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 并 且 标 志 为 1、 将 旧 数 据 标 
忘 为 0. 


25.2.4 时间 截 方式 


VK: src dxpcode. 
表 结 构 如 图 25-34 所 示 。 


CEA ceo | | 
pam wacmmentr —— | — | -— 








图 25-34 src dxpcode 表 结 构 


数据 如 图 25-35 所 示 。 
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图 25-35 src dxpcode 表 数 据 
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目标 表 结 构 : newtarget4. 
表 结 构 如 图 25-36 所 示 。 


二 ET wo | | —— | ——— 





图 25-36 newtarget4 表 结 构 


步骤 1: 在 绥 慢 变化 维 辣 导 中 ， 选 择 “Slowly Changing Dimensions (FRERE) Me, 
如 图 25-37 所 示 。 


| Wizards Getting Started... 
Debugger d Slowly Changing Dimensions... 


Kl25-37 绥 慢 变化 维 向 导 





步骤 2: 选择 “Type 2 Dimension” 单 选 按钮 ， 如 图 25-38 所 示 。 


Wew Mapping name: 


SR storychanges ?| 


Type 





Ü Type 1 Dimension - keep most recent values in targ 


(* Type 2 Dimension - keep a full history of changes in the 


fF Type 3 Dimension - keep the current and previous values in the 


SF Rei 大助 | 
K|25-38 ”模式 问 导 


步骤 3: 选择 源 表 和 目标 表 ， 如 图 25-39 所 示 。 
^V UK 4: "Logical Key Fields” 是 选择 唯一 确定 数据 的 关键 学 段 ,“Fields to compare for" 
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是 选择 需要 对 比 的 字段 ， 如 图 25-40 所 示 。 


orcl:SRC DXPCODE v 


NEWTARGET3 | 








图 25-39 JA Hb K] 25-40 ”选择 器 
步骤 5: 生成 标准 的 全 历史 记录 型 时 间 惟 方式 绥 慢 变化 维 Mapping, All 25-41 所 示 。 


SEE 
"ab 
] 17 
SEH ileneratek ENF kerProcesz 
, sing InzertHe 
EE 


SRC DXPCODE | SQ SEC DXPCOD LKP GetData | 
Draclel E Ame. in 


Li Ta 
-一 区 


EXP DetectCha SE FIL InsertHew UFD ForceInse HEWTARIETd LO 
nEss ,, Record rts raclel 


| e L3 à E n t 
>- 


EXP FerProces FIL InsertCha UPD ChangedIn 
sing InsertCh | ngedReeord serts 
anged i 


HEWIAREET4À1 [ 


Oracle] 


: = 
D - | f ! 


FIL_UpdateCha UFD ChangedUp ENP CalcTaolat i 
nEgedREecord date 所 


HETTARGET42 【 


Oracle] 





图 25-41 映射 工作 区 


整个 Mapping 分 成 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 、 将 该 历史 记录 的 结束 
时 间 置 成 当前 系统 时 间 ， 如 图 25-42 所 示 。 
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SEQ Cemeratek i EXP KeyProces 
LES HE NUI 


SRC DXPCODE ( SQ SBC DXPCOD IXP CeiDete 5 
PETIT E Ee i j aa 
10 En c 


—— MÀ 2 - = ġġ en ip 
OE Ao P^. S2 imt n Lr DP US | | 
i» =æ — p d — 
T i ` z^" 


A 


EXP beatactCha S FIL OInreriNew UPD Forcelnie 
MEEO |^ Record ris 


L Uer 3 L3, icy — y -— 3 


EXP KerfFrocez || FIL InzertCha - ES ENSUTIDIDI 
ine CL | | TTT TE] 
ETTE | 


zarte 


Oracle) 


2 TR 


VPD Chamred/p —— EXP CalcToDat | 
date . D. 


E 
Lixad duc FI 
Oracla) 





图 25-42 MY TE K ZH DX. 


ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 “true”， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目 
标 表 中 的 操作 ， 如 图 25-43 所 示 。 


ILIF(NOT ISHULL (PM PRIMARYKEY) 

AND 

( 

DECODE (ADDBLOB,PM PREV ADDBLOB,1,0) = O 
OR 

DECODE (ADDID,PM PREY ADDID,1,0) = 0 

OR 

DECODE (CODELVL,PM PREV CODELVL, 1,0) = 0 
OR 

DECODE(NAME,PM PREV NAME, 1,0) = D 

OR 

DECODE(PKNAME,PM PREV PKNAWE, 1,0) = n 
OR 

DECODE(TBNAME,PM PREV TBNAWE, 1, 0) = n 
OR 

DECODE(TYPE,PM PREY TYPE, 1,0) = D 

), TRUE, FALSE) 


25-43 ”代码 片段 


NewFlag: 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 条目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, i% Mapping 执行 插入 新 数据 的 操作 ;人 否则 为 “false”， 不 做 插入 操作 。 
IIFISNULL(PM PRIMARYKEY),TRUE,FALSE) 
当 第 一 次 执行 该 Mapping 时 ， 目 标 表 的 数据 如 网 25-44 Brzn 
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FR FEINARTKET CODE | HANE (TENANE FENANE ADDID ADUSLOB|TIPE CODELYL| FW BEGIN DATE |FE END DATE 
üs (Bs ER;FSRER a ——————— 
mo wit E eca wears — o à à o—— gpeve-»iesu 
pi  xcopRER ag EM o oo k d o — Eperexgesu[ 
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Kl25-44 ”目标 表 数 据 





总 结 : 全 历史 记录 方式 是 缓慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 发 现 源 表 中 的 
旧 数 据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作 为 新 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 
并 赋予 新 的 代理 主键 值 。 如 采 源 表 中 发 现 新 数据 ， 则 直接 插入 到 目标 表 中 。 时 间 崔 方式 是 其 
中 的 一 种 ， 主 要 包括 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 、 将 该 历史 记录 的 结束 时 
间 首 成 当前 系统 时 间 。 


25.2.5 ”记录 最 新 记录 和 上 一 次 历史 





VK: src dxpcode. 
表 结 构 如 图 25-45 所 示 。 





图 25-45 src dxpcode 表 结 构 
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数据 如 图 25-46 所 示 。 


目标 表 结 构 : 


ODE HANE  [IBHANE PKHANE ADDID AD 
3046 期 刊 素 材 lsc — Ec po — 
aoar RATU D — 
3046 | 期 刊 素材 Ec sc 0 | 
304 op — 
3050 期 刊 p | 
3051 | 计划 与 总 结 vzT [TI o0 ——— 
3001 实施 情况 BE — EgK boo 
300 m 
sus HS mr E op — 
3002 ty Rr po — 
300 p 
3004 i DETAIL D — — 
3005 |A [EZY — o 
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sepa —]x x —p—R— | 
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e 
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Ft- 
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SERO 
83020 | 进展 情况 ea za o fo n d 
[33021 | 情况 报告  [TSOKBGE TSQKBGP [o n n 





图 25-46 src dxpcode 表 数 据 


newtarget0 。 


表 结 构 如 图 25-47 所 示 。 
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purEMAR:egED Woran 8 o | —— | — [| — —— 
MI rr | | | o 
mwmmmmo p | | [ — 
Em RR secure o 
Pm Prev rename a 
I mm rr o | [qo —— 





图 25-47 newtarget6 表 结 构 


步骤 1: 在 绥 慢 变化 维 癌 导 中 ， 选 择 “Slowly Changing Dimensions (ZBERE) Me, 
如 图 25-48 所 示 。 


| Wizards Getting Started... 
Debugger d Slowly Changing Dimensions... 





[25-48 ”缓慢 变化 维 向 导 
步骤 2: 选择 “Type 3 Dimension” 单 选 按钮 ， 如 图 25-49 所 示 。 


Hew Mapping name: 


[nke epcurprevaluez| 


Type 





C Type 1 Dimension - keep most recent values in targ 


(C Type 2 Dimension - keep a full history of changes in the 


(* Type 3 Dimension - keep the current and previous values in the 


€ Eo [TE > 取消 | am | 
图 25-49 ”模式 问 导 


步 又 3: 选择 源 表 和 目标 表 ， 如 图 25-50 p. 
^V UK 4: "Logical Key Fields” 是 选择 唯一 确定 数据 的 关键 字 段 ,“Fields to compare for" 
是 选择 需要 对 比 的 字段 ， 如 图 25-51 所 示 。 





Select Source Table 
[or cl:SRC DXPCODE = | 


Target Table Fields Logical Key Fields 


CODE 
New Target Table Add >> | 
[WewTARGETS 
<< Remove | 


Fields to compare for 





ADDELOE a 
: j |ADDID 
TE CODELVL 
emove | NAME 
PKNAME | 








«r-5mg|r—5mo»| mih 帮助 | «r-5e[t—5o»| mi | s | 





K| 25-50 WRM HERK 图 25-51 选择 器 





步骤 5: 生成 标准 的 最 新 记录 和 上 一 次 历史 记录 的 绥 慢 变化 维 Mapping, 如 图 25-52 所 未 。 
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M E 
LIS: 
i-a 4| - 
an [3 
nE m 
1 = 

[414 


SEH í-eneratek 
art Date InsertHe 
Ww 


SRC DEPCODE [ Su SRC INPCOD LKP Getlata MA 
Oracle] E xe. 
Di 


EXP DetectCha | FIL_InsertHew 
MEES CREDI 


FIL UpdateCha 
ngedRecord 


图 25-52 ”映射 工作 区 


WPD ForceInse 
rts 


WPD ChangedUp 
date 





HEWTARGETE LO 


racle] 


EXP Effective | 
Date InsertCh 
anged 


HEWTIAREETEl1 | 


Oracle] 


整个 Mapping 分 成 两 个 部 分 : 新 数据 的 插入 、 旧 记录 修改 后 放 入 到 最 新 的 位 置 上 ， 同 时 


将 原 记 录 移 到 旧 的 位 置 上 ， 如 图 25-53 所 示 。 


i "a ^ : 
可 之 : "T 
M A 


SEQ Cemeratel EXF Effective 
LES Date EH TRE 
w 


; "JU 
SEC DXPCODE | Sy SEC DXFCOD LIF Ge!Da!a 
Oracle) E 


- pi 
cT . 
E 


1 
EAF DeteciCh FIL inser!New 
nges Record 

m 


y 
l 


FIL UpdateCha 
ar e di 


WD ChangedUp 
date 





K| 25-53 ”映射 工作 区 的 数据 区 


ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 “true”， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目 


标 表 中 的 操作 ， 如 图 25-54 所 示 。 
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HERTARGETE [ii 
racle) 


f 


EXT Effective 
Date InzertCh 
anged 


di 


a è 1 
"d pt 
T... 
| 


KERTA ETGI i 
Oracle) 


IIF(NOT ISHULL PM PRIMARYKET) 

AND 

i 

DECODEiADDBLOB,PM PREV ADDBLOB, 1,0) = 0 


OR 

DECODE (ADDIO, PM_PREV_ADDID, 1,0) = 0 
OR 

DECODE (CODELVL,PM PREY CODELVL,1,0) = 0 
OR 

DECODE (NAME, PM PREV NAWE,1,0) = 0 

OF 

DECODE (PKNAME, PM, PREV PENAME, 1, 0) = 0 
OF 

DECODE (TBNAME, PM PREV TBNAME, 1,0) = 0 
ÜR 


DECODEiTYPE,PM PREV TYPE,1,0) = ü 
J, TRUE, FALSE) 


图 25-54 ”代码 片段 


NewFlag: 判断 该 数据 是 售 为 新 数据 的 标识 字段 。 如 末 目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, iZ Mapping 执行 插入 痢 数 据 的 操作 ; 人 否则 为 “false”， 不 做 插入 操作 。 
IIF(.ISNULL(PM PRIMARYKEY),TRUE,FALSE) 
总 结 : 记录 最 痢 记 录 和 上 次 历史 记录 的 绥 慢 变化 维 是 不 太 和 常见 的 一 种 方式 。 它 主要 包 
括 两 个 部 分 : 狐 数 据 的 插入 和 旧 记 录 修 改 后 放 入 到 最 新 的 位 置 上 , 同时 将 原 记 录 移 到 旧 的 位 
Hb. 


























29.3 ”本 章 小 结 








1) 在 现实 世界 中 ， 维 度 的 属性 会 随时 间 的 流逝 而 发 生 缓慢 的 变化 。 将 发 生变 化 的 维度 称 
作 “ 缓 慢 变 化 维 ” 它 是 一 种 ETL 对 数据 仓库 维度 表 的 更 新 技术 。 

2) 在 数据 仓库 中 ， 事 实 表 的 设计 通常 包含 多 个 代理 主键 ,周围 环绕 看 多 个 维 表 ， 当 维 表 
的 数据 发 生变 化 时 ， 数 据 仓 库 需 要 立刻 发 现 这 种 维度 的 变化 。 

3) 绥 慢 变化 维 的 实现 方式 : 采用 和 窗 新 方式 、 全 历史 记录 方式 、 标 记 位 方式 、 时 间 惟 方式 、 
记录 最 新 记录 和 上 一 次 历史 的 方式 。 

4) 缆 焉 方式 是 绥 慢 变化 维 中 相对 简单 的 一 种 方法 。 其 特点 是 保证 数据 仓库 中 的 数据 始终 
古 最 新 的 ， 不 保留 历史 数据 。 如 果 发 现 新 数据 ， 则 将 新 数据 加 载 到 目标 表 中 。 如 果 数 据 发 生 
改变 ， 则 执行 更 新 操作 。 

5) 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 肥 现 源 表 中 的 旧 数 
据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作为 新 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 并 赋 
予 新 的 代理 主键 值 。 

6) 记录 最 新 记录 和 上 次 历史 记录 的 绥 慢 变化 维 是 不 太 第 见 的 一 种 方式 。 它 主要 包括 两 个 
部 分 : 新 数据 的 插入 和 旧 记 录 修 改 后 放 入 到 最 新 的 位 置 上 ， 辣 时 将 原 记 录 移 到 旧 的 位 置 上 。 
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4526 4t Cognos 安 疙 与 快速 人 门 


本 章 目标 

在 学 习 Cognos 工具 的 使 用 之 后 ， 本 章 将 讲解 Cognos 的 安装 与 快速 入 门 的 实例 。Cognos 
的 安装 主要 分 为 服务 器 安装 、Framework 建 模 工具 安装 、Transformer 立方 体 安 装 3 部 分 ， 扩 
展 的 安装 有 PowerPlay 安 状 等 。 

学 习 本 章 后 ， 您 将 掌握 : 

€ Cognos HJ ZITTE. 

€ Framework 建 模 工具 的 使 用 。 

€ Transformer 立方 体 多 维 建 模 工 具 的 使 用 。 

@ 使 用 Report Studio 开发 报表 。 

e 使 用 Analysis Studio 开发 多 维 报表 。 














26.1 Cognos 8 安装 


Cognos 8 的 安装 分 为 4 个 部 分 。 
€ Cognos 服务 絮 的 安装 。 
€ Cognos Framework 的 安装 。 





€ Cognos Transformer 的 安装 。 
@ Cognos 语言 包 的 安装 。 


26.1.1 Cognos 服务 如 安装 
首先 进入 Cognos 安装 界面 ， 选 择 安 装 语言 ， 选 择 “English” 版 本 ， 如 图 26-1 所 示 。 


Y Cognos 8 Business Intelligence Server 








> C Welcome to the Installation Wizard 
e Ins ation Wizard helps you ins ognos products or a 
* The Installat W d hel tall C duct dd 
components to an existing installation. 
For detailed information, view the Installation Guide and 


License Readme. 


Installation Location Installation Language Selection 
Component Selection 
Shortcut Folder 


Summary 


Select the language you want to use to run this install. 
Deutsch (German) 
English Mefault) 
Progress Français (French) 


Finish 日 本 话 (rinase) 


You can select 'Back at any time to change your selections. 


Please select 'Next' to start installing. 


Copyright (C) 200T Cognos Incorporated. All rights reserved. 


cesa. | 





图 26-1 Cognos 安装 界面 


了 42 


XCPEZUCRdH JH. "abs "Next" JE, WE 26-2 p. 
¥ Cognos 8 Business Intelligence Server 


License Ágreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Welcome Cognos, the end-user license agreement below applies to you. 
p License By continuing with this installation, you confirm your acceptance of 
Installation Locati the terms and conditions. If you do not agree with them, stop the 
ns ON LocaLLon installation and return the entire package to your authorized Cognos 


Component Selection representative within two weeks for a full refund. 
Shortcut Folder 


Summary NTENTS: This software product ("Software") consists of trade 
secrets and intellectual property belonging to, or licensed by, 
Cognos Incorporated, residing on this medium ("Medium") and 


Progress 
Finish elated user documentation ("Related Documentation"). 


TITLE: Ownership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
roperty of Cognos and its licensors. 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


(^ I do not accept 


cma | 
26-2 Cognos ZZTN In] 
然后 单 击 “Next” 按 钮 ， 进 入 本 地 安装 设置 负面 ， 选 择 要 安 疙 的 路 人 符 ， 如 图 26-3 所 示 。 


¥ Cognos 8 Business Intelligence Server 





Installation Location 


Installation Directory: 
Welcome [C:\Program Filesicognosic8 EH 
License 
p Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 


Drive | Available Drive Type ^ 


(C: 21.55 GB 834.94 MB 
17.02 GB .00 Bytes 


cma | 
26-3 Cognos 安装 路 径 癌 导 


选择 好 安 闭 路 径 后 ， 单 击 “Next” 按 钮 ， 进 入 Cognos HIFR AFE FR, "ll 26-4 
所 示 。 








学 :Cogmnos 8 Business Intelligence Server 


Component Selection 
Which components do you want to install or upgrade? 


Welcome 
licanse -|Cognos 8 Business Intelligence Server 


-wy ~| Application Tier Components 
y v| Gateway 
-y v| Content Manager 


Installation Location 
p Component Selection 

Shortcut Folder " " 
RAA iC onos Content Database 
Summary 
Progress 
Finish 


Description Disk Space 


Cognos Content Database Total aque d: 


848.58 MB 


€ Back Cancel | 








26-4 Cognos 7ZZX&2H TF [n] S 
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单 击 “Next” 投 钮 ， 进 入 快捷 方式 选择 页 面 ， 默 认 系统 选 择 即 可 ， 如 图 26-5 Br. 


f: Cognos 8 Business Intelligence Server 


Welcome 
License 
Installation Location 
Component Selection 
p Shortcut Folder 
Summary 
Progress 
Finish 
gnos 8 
8 (Framework) 


wor 
Cognos 8 (Transformer) 


SET 
GIGABYTE 
ar ~ ~ cn mi AS Zb/ ue 





图 26-5 Cognos 安装 快捷 方式 问 导 
单 击 “Next” 投 钮 ， 系 统 显 示 安 装 的 信息 。 如 果 需 要 修改 ， 则 直接 单 击 “Back” 按 钮 返 
回 操作 ， 如 图 26-6 所 示 。 


Æ Cognos 8 Business Intelligence Server 


Installation Location 
Component Selection 
Shortcut Folder 

p Summary 
Progress 
Finish 





图 26-6 Cognos 安装 信息 提示 
Cognos 服务 占 安 装 完成 后 ， 可 以 选择 查看 日 志 或 者 启动 Cognos 配置 工具 ， 如 图 26-7 
所 示 。 








£ Cognos 8 Business Intelligence Server 


Welcome 

License 

Installation Location 
Component Selection 
Shortcut Folder 





图 26-7 Cognos 安装 成 功 界 面 
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TIE, Cognos 服务 器 安装 完成 。 


26.1.2 Cognos Framework 安装 


首先 进入 Framework 2237, Al 26-8 所 示 。 


学 :Cogmnos 8 Business Intelligence Nodeling 


Welcome to the Installation Wizard 


The Installation Wizard helps you install Cognos products or add 
components to an existing installation. 


p Welcome For detailed information, view the Installation Guide and 
License z - Readme. 
Installation Location  [nstallation Language Selection 
Component Selection M 
Select the language you want to use to run this install. 
Shortcut Folder 
Deutsch (German) 
English ^ (De£ault) 
s Francais (French) 
Finish 日 本 语 (Tapanasa) 


Summary 
Progress 


You can select 'Back' at any time to change your selections. 


Please select 'Next' to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 





€ Back Cancel | 





26-8 Framework 安装 界面 


选择 安装 语言 ， 单 击 “Next” 按 钮 后 ， 进 入 到 安装 协议 同 导 页 面 ， 如 图 26-9 所 示 。 


W Cognos 8 Business Intelligence Modeling 


License Ágreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Welcome Cognos, the end-user license agreement below applies to you. 
þ License By continuing with this installation, you confirm your acceptance of 
I f ; the terms and conditions. If you do not agree with them, stop the 
nstallation Location 


installation and return the entire package to your authorized Cognos 
Component Selection representative within two weeks for a full refund. 


Shortcut Folder 


Summary CONTENTS: This software product ("Software") consists of trade 
secrets and intellectual property belonging to, or licensed by, 
Cognos Incorporated, residing on this medium ("Medium") and 
Finish related user documentation ("Related Documentation"). 


Progress 


TITLE: Ownership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


(C I do not accept 





mea | 





26-9 Framework 安装 协议 癌 导 


选择 “Iaccept” 单 选 按钮 ， 然 后 单 击 “Next” 按 钮 ， 进 入 安 闭 路 径 问 导 页 面 ， 如 图 26-10 
所 示 。 





学 :Cognos 8 Business Intelligence Modeling 


Installation Location 





Installation Directory: 


Welcome [C:\Program Files\cognos\Framework ES 
License 
p Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 





Drive | Available Drive Type ^ 


= (C:) 20.62 GB 145. T3 MB Local 
EE (Q:) SOFTWARE 17.02 GB .00 Bytes Local v 
z s ! |a 一 





Cacal | 
26-10 Framework Z3 EE Ja] 
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ERR HKA fab "Next" PROS, XEA LOREHTIIS ug, WE 26-11 Br. 


学 : Cogmnos 8 Business Intelligence Modeling 


Component Selection 


Which components do you want to install or upgrade? 


Welcome 
ehdlCoanos 8 Business Intelligence Modeling 


-y v| Framework Manager 
- Y ~| Map Manager 


License 

Installation Location 
p Component Selection 

Shortcut Folder 

Summary 

Progress 

Finish 


Description Disk Space 
Installs Cognos 8 Business Intelligence . Total required: 


Modeling component (s) on one computer 563.54 MB 





€ Back Cancel | 








26-11 Framework 安装 组 件 癌 导 


默认 都 选择 后 ， 单 击 “Next” 按 钮 ， 进 入 到 快捷 方式 疝 杜 页面， 如 图 26-12 所 示 。 


¥ Cognos 8 Business Intelligence Nodeling 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


Welcome To put these shortcuts in a different folder, select an existing 


license folder from the list, or enter a new folder name. 


Installation Location Prou Elder 
Component Selection z cg D 
p Shortcut Folder ognos ramewor 
S 
nd Existing folders: 
Progress 


Finish 
pit 
合 歌 金山 词霸 合作 版 
管理 工具 

光盘 刻录 

Bash 


ht M 


[v Make the shortcuts visible to all users 





€ Back Cancel | 





26-12 Framework 安装 快捷 方式 回 导 


这 里 ， 最 好 不 要 和 Cognos 安 闭 目录 放 在 一 起 ， 填 好 后 单 击 “Next” 按 钮 ， 系 统 显 示 全 部 
安装 信息 ， 如 图 26-13 所 示 。 


(Cognos 8 Business Intelligence Modeling 


Installation Summary 


The Cognos Installation Wizard is ready to install the components you 
selected. 

Welcome If you want to review or change any settings, select 'Back'. 

ticat If you are satisfied with the settings, select 'Next'. 

Installation Location Current Settings: 

Component Selection 

elected Components: 
Shortcut Folder Cognos 8 Business Intelligence Modeling 
p Summary Framework Manager 
Progress Map Manager 


Finish 


ocal disk space information: 


rive: Available: Required Estimate: 
aN 20.62 GB 630. 99 MB 


ialog Entry Information: 
[Installation Location] 


< 山 





< Back Cancel | 





26-13 Framework 安装 信息 界面 
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该 过 程 大 概 会 持续 儿 分 钟 ， 请 耐心 等 每 ， 安 疙 成 功 界 面 如 图 26-14 所 示 。 


Y Cognos 8 Business Intelligence Modeling 


Welcome 
License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 

p Finish 


The Cognos Installation Wizard is complete. 
All selected components were transferred successfully. 


View the summary-error log. 


| View the transfer log. 


Please select ‘Finish’ to close the Wizard. 


[ View Cognos Readme 
[ Start Cognos Configuration 








图 26-14 Framework 安装 成 功 界面 


出 现 这 个 界面 ， 说 明 Framework 已 经 成 功 安 装 ， 单 击 “Finish” 按 钮 结束 安装 。 





26.1.3 Cognos Transformer 安装 


首先 进入 Transformer 安装 界面 ， 如 图 26-15 PZR. 


Y- Cognos 8 Business Intelligence Iransformer 


j Welcome 
License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Welcome to the Installation Wizard 


The Installation Wizard helps you install Cognos products or add 
components to an existing installation. 


For detailed information, view the Installation Guide and 


Readme. 
Installation Language Selection 


Select the language you want to use to run this install. 
Deutsch (German) 

English — (Default) 

Frangais (French) 

B45 (Japanese) 


You can select 'Back at any time to change your selections. 


Please select Next’ to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 








图 26-15 Transformer 安装 界面 


XufEuCEd RH. Hab "Next" Poe. EARRAN, WE] 26-16 Brz. 


F Cognos 8 Business Intelligence Transformer 


Welcome 

p License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


License Ágreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Cognos, the end-user license agreement below applies to you. 


By continuing with this installation, you confirm your acceptance of 
the terms and conditions. If you do not agree with them, stop the 
installation and return the entire package to your authorized Cognos 
representative within two weeks for a full refund. 


CONTENTS: This software product ("Software") consists of trade 
secrets and intellectual property belonging to, or licensed by, 
Cognos Incorporated, residing on this medium ("Medium") and 
related user documentation ("Related Documentation"). 


TITLE: Üwnership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


(C I do not accept 








< Back Cancel | 


图 26-16 Transformer 安装 协议 向 导 
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选择 “Iaccept” 单 选 按 钮 ， 然 后 单 击 “Next” 按 钮 ， 进 入 安装 路 径 癌 导 页 面 ， 如 图 26-17 
所 示 。 


学 : Cogmos 8 Business Intelligence Transformer 


Installation Location 
Installation Directory: 


FE: MProgram Files\cognos\Transformer Sa | 


Welcome 
License 

j Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 


Available 
S (c) 21.02 GB 430.22 MB 
(D:) SOFTWARE — 17.02 GB —— .00 Bytes 


$i 


Drive Type A 








cmon | 


26-17 Transformer 安装 路 径 问 导 





选择 要 安装 的 目录 后 ， 单 击 “Next” 按 钮 ， 进 入 安装 组 件 向 导 页 面 ， 


时 了 4 


如 图 26-18 所 示 。 


Component Selection 


Which components do you want to install or upgrade? 


Welcome 


License 

Installation Location 
p Component Selection 

Shortcut Folder 

Summary 

Progress 

Finish 


Lee ow iC onos 8 Business Intelligence Transformer 
-y ~| Cognos 8 Transformer 
vj Series T IQD Bridge 


Description Disk Space 
Installs Cognos 8 Transformer A | Total required: 
component Ís) on one computer E 430.22 MB i 








Pe 





26-18 Transformer 安装 组 件 问 导 


默认 都 选择 后 ， 单 击 “Next” 按 钮 ， 进 入 到 快捷 方式 向 村 页 面 ， 如 图 26-19 Br. 


©- Cognos 8 Business Intelligence Transformer 





Welcome 

License 

Installation Location 

Component Selection 
p Shortcut Folder 

Summary 

Progress 

Finish 








E 
Shortcut Folder 
Shortcuts will be added to the folder shown. 


To put these shortcuts in a different folder, select an existing 
folder from the list, or enter a new folder name. 


Program folder: 


[Cognos 8 (Transformer) 


Existing folders: 


ESET 

GIGABYTE : 
HyperSnap 5.62.01 免 注册 汉化 版 
Informatica PowerCenter 8.1.1 
Microsoft Office 

Üracle - ÜraDbiOg homel 
SoTower Studio 


M Make the shortcuts visible to all users 


了 mp 
26-19 Transformer ZR DE Jj 3X IRI 
这 里 ， 最 好 不 要 和 Cognos 安装 目录 放 在 一 起 ， 然 后 单 击 “Next” 按 钮 ， 
3 了 46 


系统 显示 安装 信 


HK. Ul 26-20 PZR. 


Æ Cognos 8 Business Intelligence Transformer 


Welcome 

License 

Installation Location 
Component Selection 
Shortcut Folder 





图 26-20 Transformer 安装 信息 界面 


确认 无 误 后 ， 单 击 “Next” 按 钮 ， 开 始 安装 。 
最 后 单 击 “Finish” 按 钮 结束 安装 ， 如 图 26-21 所 示 。 





É Cognos 8 Business Intelligence Iransformer 


Welcome 
License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 

j Finish 


nci 


图 26-21 Transformer 安装 成 功 界 面 


26.1.4 Cognos 语言 包 安 装 
首先 选择 安装 语言 ， 如 图 26-22 所 示 。 


FCognos 8 Business Intelligence Supplementary Languages 


p Welcome 
License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 


Deutsch (German) 


: English 
rogress Français (French) 
Finish BA (Japanese) 








图 26-22 ”语言 包 安装 界面 
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接受 安装 协议 ， 如 图 26-23 所 示 。 


Æ Cognos 8 Business Intelligence Supplementary Languages 


Welcome 

p License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 





图 26-23 语言 包 安 装 协 议 问 导 
选择 Cognos 的 安装 目录 ， 如 图 26-24 所 示 。 


Cognos 8 Business Intelligence Supplementary Languages 





Welcome D:*cognosic8 


License 

p Installation Location 
Cognos Running Services 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


22.71 GB .00 Bytes 
15.44 GB 343.93 MB 





图 26-24 iEn eu n^ 


WA WX. üW 26-25 所 示 。 


F. Cognos 8 Business Intelligence Supplementary Languages 





Welcome 
License 

p Installation Location 
Cognos Running Services 


Finish 


22.71 GB .00 Bytes 
15.44 GB 343.93 MB 


| 





图 26-25 语言 包 安 装 路 径 提 示 问 导 
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系统 提示 停止 Cognos 正在 运行 的 服务 ， 如 图 26-26 所 示 。 


F.Cognos 8 Business Intelligence Supplementary Languages 


Welcome 

License 

Installation Location 
p Cognos Running Services 


Component Selection £gnos 8 
Shortcut Folder Cognos Content Database 


Summary 
Progress 
Finish 

















图 26-26 语言 包 安装 关闭 程序 提示 界面 
选择 安装 组 件 ， 如 图 26-27 所 示 。 


FCognos 8 Business Intelligence Supplementary Languages 


Welcome 

License 

Installation Location 
Cognos Running Services 


Dutch 
Finnish 
Italian 
Portuguese 
Russian 


p Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 








图 26-27 语言 包 安 装 组 件 问 导 


选择 快捷 键 安装 路 径 ， 如 图 26-28 所 示 。 


F Cognos 8 Business Intelligence Supplementary Languages 


Welcome 
License 
Installation Location 
Cognos Running Services 
Component Selection 

p Shortcut Folder 


Summary 


Progress Borland StarTeam 
Finish Cognos 8 
Cognos Framework 
Cognos PowerPlay 
Cognos Transformer 


ATALDI 








图 26-28 语言 包 安 装 快捷 方式 问 导 
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系统 显示 安装 信息 ， 如 网 26-29 所 示 。 


¥ Cognos 8 Business Intelligence Supplementary Languages 


Installation Summary 


The Cognos Installation Wizard is ready to install the components you 
selected. 
Welcome If you want to review or change any settings, select 'Back . 


cene If you are satisfied with the settings, select 'Next'. 


Installation Location Current Settings: 


Cognos Running Services 

; Selected Components: 

Component Selection Cognos 8 Business Intelligence Supplementary Languages 
Shortcut Folder Simplified Chinese 


p Summary 
Progress 
Finish T ^ 3 
Local disk space information: 


Available: Required Estimate: 
22.71 GB 72. T3 MB 
15.44 GB 78.33 MB 


Dialog Entry Information: 
[Installation Location] 











< Back Cancel | 











26-29 语言 包 安 装 信息 界面 
安装 结束 后 ， 如 图 26-30 所 示 。 


© Cognos 8 Business Intelligence Supplementary Languages 
Finish 


The Cognos Installation Wizard is complete. 
^K All selected components were transferred successfully. 
elcome 


License 
Installation Location 
Cognos Running Services i View the transfer log. 
Component Selection 
Shortcut Folder i View the summary-error log. 
Summary 
Progress 
p Finish 


Please select Finish to close the Wizard. 
[ View Cognos Readme 


Backup Location: 
D:*cognos*c8Nuninstall'backuphlp 20110508 1452^ 





eaa | 
图 26-30 语言 包 安 装 成 功 界面 
Cognos 语言 包 安 猜 完 之 后 ， 需 要 进行 配置 才能 生效 。 
接 下 来 ， 介 绍 Cognos 的 语言 包 配 置 步 骤 。 首 先 ， 打 开 “Cosgnos Configuration” 工 具 ， 选 
Jx “Action” —> “Edit Global Configuration”， 如 图 26-31 所 示 。 


Cognos Configuration 一 WWW-CF63B08936C 
Elle Edi View Help 


回 | > mi 5t 


Explorer 
Eb Local Configure 
G-[& Environme Mills de E Eni TEST 
[Di Cogo Test 
G Ig Loggin 
i t Fil 
gnos 8 service 
i B Cognos 8 
$ Portal Services 
日 -[ 晶 security 

















m 

















Stop 







Restart Local Configuration - Computer Properties 










Advanced properties «click the edit button 















Build Application Files... 








gnos Application Firewall 
日 [8 Data Access 
日 Ug Content Manager 
i ognos 

Notification 
Cognos Planning 
Contributor Data Server 


Groups related properties into functional areas For the components installed on the local computer. 









After you install one or more Cognos 8 components on your computer, you must configure them to work in your reporting environment, Default 
property settings chosen by Cognos are used to configure the components. You may want to change these default settings if there are conditions 
that make the default choices inappropriate, or to better suit your environment. Use Cognos Configuration to configure Cognos 8 components after 
you install them, reconfigure Cognos 8 components if a property changes or you add components to your environment, or to start or stop the Cognos 
8 service on the local computer. After you make the changes, save your configuration and then start the Cognos 8 service to apply new settings to 
your computer. 








Checking service status... 





26-31 "Cognos Configuration” 配 置 界面 


3352 


然后 在 “Product Locales ”选项 卡 中 添加 “zh-cn” 中 文 规则 ， 如 图 26-32 所 示 。 


slobal Configuration 


Product Locale Mappings | Content Locale Mappings | Currencies | Fonts | General 
Product Locales | Content Locales 


| Description 


Chinese (China) 


mr mE 
[x] 





26-32 ”添加 zh-cn 中 文 规则 
在 General 选项 卡 中 ， 将 “Server locale” WARAH “zh-cn”, lll 26-33 所 示 。 


global Configuration 


Product Locales Content Locales 
Product Locale Mappings | Content Locale Mappings | Currencies | Fonts General 





Server locale o 

Server time zone e (GMT--08:00) Asia, Shanghai 
3* Default font Andale WT 

Email Encoding LITF-8 

Archive Location File System Foot 

















Ce Coe 





26-33 ”中 文 设置 


设置 完 之 后 ， 重 启 Cognos 服务 。 
然后 进入 Cognos Connection, XEF% “My Preferences” 选 项 ， 进 入 “首选 项 ”设置 界面 ， 
如 图 26-34 所 示 。 


My Wakbch Items 


: My Preferences | 
: P : 国 
LES My Activities and Schedules |= X EET Ji 


Entries: 1. |-[s — | | «imn 
26-34 “EAW” CELA IRI 
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安装 设置 如 下 : 


Set preferences 


General Personal 


Specify your settings. 


Number of entries in list view: 


Separators in list view: 


Portal Tabs 





进行 语言 的 设置 ， 然 后 保存 即 可 ， 如 图 26-35 所 示 。 


Report format: 
[HTML x] 








Automatic refresh rate in seconds: 


Style: 


Corporate * | Preview 


Show the Welcome page at startup 
Show a summary of the run options 


Portal 


Default view: 
© List 


Q Details 


Number of columns in details view: 


Regional options 


Product language: 


Chinese (China) ™ 


Time zone: 


Content language: 


Chinese (China) M 











26-35 "Context Language" ix E-A- M 


26.1.5 Cognos PowerPlay 安装 


双击 安装 PowerPlay 的 程序 ， 选 择 “Install Cognos 8 Business Intelligence OLAP Modeling 
8.1 Windows” Xm, AHP 26-36 Dr. 


É* Cognos 8 Business Intelligence OLAF Nodeling 8... x] 


COGNOS 
EN a 33 |  — BEEN 


View the Install Documentation and Readme 
Install Support Files 
Inztall Cognos & Business Intelligence OLAF Modeling 5.1 Winda 


Wisit Cognos on the Web 











Copyright (L) 2005 Cognos Incorporated. 
For details 


All rights reserved. 
click 1g 





26-36 PowerPlay 安装 界面 


随后 弹出 欢迎 界面 ， 如 图 26-37 所 示 。 
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Æ Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


j Welcome 
License 
User Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 
Progress 
Configuration 
Finish 





图 26-37 PowerPlay 欢迎 界面 


接受 安装 协议 ， 如 图 26-38 所 示 。 


* Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


User Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 

Progress 

Configuration 

Finish 





图 26-38 PowerPlay 安装 协议 向 导 


输入 用 户 信 息 ， 如 图 26-39 Pr. 


Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Welcome 
License 


) User Information 


Installation Type 
Component Selection 


Character Set Selection 
Installation Location 


Shortcut Folder 


Summary 
Progress 
Configuration 
Finish 








图 26-39 PowerPlay 用 户 信息 向 导 
选择 安装 类 型 ， 这 里 选择 上 自 定 义 安装 ， 如 图 26-40 Wr. 
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Welcome 
License 
Vser Information 

p Installation Type 
Component Selection 
Character Set Selection 


Installation Location 


Shortcut Folder 
Summary 
Progress 
Configuration 
Finish 





图 26-40 PowerPlay ZI n] Sy 


选择 安装 组 件 ， 如 图 26-41 所 示 。 


时 了 4 


Welcome 
License 
User Information 
Installation Type 

p Component Selection 
Character Set Selection 
Installation Location 


PowerPlay for Windows [Installed] 

PowerPlay for Excel [Installed] 

PowerPlay Transformer Client for UNIX [Installed] 
Access Manager Administration [Installed] 
PowerPlay Transformer Edition Tools [Installed] 
PowerPlay Transformer Edition Quick Tours [Installed] 
PowerPlay Transformer Edition Samples [Installed] 
Shortcut Folder : Default Font [Installed] 

Summary 

Progress 

Configuration 

Finish 





图 26-41 PowerPlay 安装 组 件 向 导 


接 下 来 选择 安装 语言 ， 如 图 26-42 PR. 


F.Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Welcome 
License 
User Information 
Installation Type 
Component Selection 

p Character Set Selection 
Installation Location 
Shortcut Folder 


Summary 


Progress 
Configuration 
Finish 





图 26-42 PowerPlay 本 地 化 向 导 
接着 选择 安装 路 径 ， 如 图 26-43 所 示 。 
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Æ Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Vser Information 

Installation Type 

Component Selection 

Character Set Selection 
j Installation Location 

Shortcut Folder 

Summary 

Progress 

Configuration 

Finish 


E 22.71 GB 109.21 MB 
:) SOFTWARE 15.24 GB 260.67 MB 





图 26-43 PowerPlay Ze n s 


然后 选择 安装 快捷 键 路 径 ， 如 图 26-44 ITIR. 


Æ Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


License 
Vser Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
p Shortcut Folder 
Summary 
Progress 
Configuration Cognos Transformer 
Finish ESET n 





图 26-44 PowerPlay 安装 快捷 方式 问 导 


随后 系统 提示 安装 信息 ， 如 图 26-45 Br. 


É Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Welcome 

License 

Vser Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 


p Summary 


Progress 
Configuration 
Finish 





图 26-45 PowerPlay 安装 信息 界面 
单 击 “Next” 按 钮 后 ， 开 始 安装 ， 随 后 进入 安装 组 件 问 导 ， 如 图 26-46 Br. 
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Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Component Configuration 


Transfer is complete. 
You must configure the components to complete the installation. 
Welcome 


License 


User Information To configure components using the Configuration Manager: 


. (1) set the property values 
Installation pe (2) validate property values 
Component Selection (3) apply property values 
Character Set Selection (4) start services (if required) 
Installation Location 
Shortcut Folder 
Summary C Configure components with defaults. 


You have the following configuration choices: 


Do es (e Open the Configuration Manager to customize component 


p Configuration configuration. 


Finish Exit the Installation Wizard without configuring components. You 
C must later configure the components to complete the 
installation. 








图 26-46 PowerPlay 安装 组 件 向 导 


此 时 安装 完成 ， 如 图 26-47 所 示 。 





© Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 
Finish 


The Cognos Installation Wizard is complete. 
Àll selected components were transferred successfully. 
Welcome Configuration Manager terminated successfully. 


License 
User Information 
Installation Type 


Component Selection 


View View the transfer log. 


f View View the summary-error log. 
Character Set Selection 


Installation Location 
Shortcut Folder 


Summary 


View View the configuration log. 


Progress 


Configuration 
p Finish Please select 'Finish to close the Wizard. 


[ View the Readme 





Finish Cancel | 





图 26-47 PowerPlay 安装 成 功 界 面 


接 下 来 束 可 以 使 用 PowerPlay 了 。 


26.2 (Cognos 入 门 前 的 准备 工作 


26.2.1 创建 Oracle 数据 库 实例 


单 击 “开始 ”一 “程序 ”一 “Oracle - OraDbl0g homel” 一 “配置 和 移植 工具 ”一 “Database 
Configuration Assistant” 命 令 ， 弹 出 如 图 26-48 所 示 的 对 话 框 。 
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Max) 





图 26-48 Oracle 安装 界面 


单 击 “ 下 一 步 ” 按 钮 ， 选 择 “ 创 建 数据 库 ” 单 选 按钮 ， 如 网 26-49 Dr. 


uration åssistant, Wẹ% 1( 共 12 b) : 操作 





图 26-49 Oracle 安装 问 导 


单 击 “ 下 一 步 ” 按 钮 ， 选 择 创 建 数 据 库 的 模板 ， 如 图 26-50 Pin. 


E: Database Configuration Assistant, 步骤 2( 共 12 步 ) : 数据 库 模 板 加 回国 





图 26-50 Oracle 安装 模板 问 导 


单 击 “ 下 一 步 ” 按 钮 ， 和 输入 要 创建 的 数据 库 实 例 名 ， 如 图 26-51 Br. 
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NENTEETETERUENEETTTm ME) 


COGNOS 





COGNOS 








图 26-51 输入 要 创建 的 数据 库 实例 名 
单 击 “ 下 一 步 ” 投 钮 ， 管 理 选 项 使 用 默认 设置 ， 如 图 26-52 所 示 。 


É:Database Configuration Assistant, W8 4( 共 12 F) : 管理 选项 回回 加 





图 26-52 Oracle 管理 选项 设置 


单 击 “ 下 一 步 ” 按 钮 ， 设 置 创 建 的 数据 库 实 例 账 总 的 登录 密码 ， 如 网 26-53 Pin. 


E: Database Configuration Assistant, W8 5( 共 12 F) : S$583EPES DPuEHH 











图 26-53 Oracle 吴 份 验证 设置 
单 击 “ 下 一 步 ” 投 钮 ， 选 择 数据 库 的 存储 机 制 ， 如 图 26-54 所 示 。 
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E: Database Configuration Assistant, ?b9€ 6 (Jb 12 F) : 存储 选项 





图 26-54 Oracle 存储 设置 


单 击 “ 下 一 步 ” 欣 钮 ， 指 定数 据 库 文件 在 人 磁盘 的 存储 位 置 ， 如 图 26-55 Pra. 


E: Database Configuration Assistant, 8 7( 共 12 步 ) : 数据 库 文件 所 在 位 置 加 回国 








图 26-55 Oracle 文件 存储 位 置 设置 
单 击 “ 下 一 步 ” 投 钮 ， 进 行 数 据 库 实 例 的 恢复 设置 ， 如 图 26-56 Dr. 


É:Database Configuration Assistant, 8 8( 共 12 F) : 恢复 配置 加 回国 


(ORACLE BASEMflash recovery arei — 

I 天 -一 一 一 
pos Bey 
us 


TE MER 











图 26-56 Oracle 恢复 设置 


单 击 “下 一 步 ” 按钮 ， 执 行 运行 的 脚本 ， 暂 时 先 不 运行 ， MEPESRA CES WE] 26-57 所 示 。 
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É:Database Configuration Assistant, Wẹ 9 (JE 12 F) : ERFAR 


定制 脚本 | 


创建 数据 库 后 , 请 指定 希望 运行 的 SQL 脚本 。 脚 本 按 其 在 以 下 表 中 的 顺序 运行 。 
fe 没有 要 运行 的 脚本 


一 个 运行 以 下 脚本 
B 











添加 .| SES) 











文件 位 置 变量 





$ ”上 一 步 (B) 
图 26-57 Oracle 内 容 设 置 


单 击 “ 下 一 步 ” 按 钮 ， 数 据 库 实例 的 初始 化 参数 设置 包含 “内 存 ”“ 调 整 大 小 ”“ 字 符 集 ” 
和 “连接 模式 ”4 个 选项 卡 ， 如 图 26-58 Pp. 


É:Database Configuration Assistant, 29€ 10( 共 12 步 ) : 初 妨 化 考 数 





内 存 | 调整 大 小 FER ESER 
fe 典型 - 按 物 理 内 存 总 有 量 (2037 MB) 的 百分比 分 配 内 存 
mat [o | 全 mmm...) 


C 定制 

共享 内 存 管理 : 6 自动 C Fa 

SGA 大 小 [ps —  — —J8 
PGA X 183 


5 | MB 
SEIT rr 





D 内 存 总 量 包 括 40MB 的 Oracle 进程 大 小 以 及 用 于 空 参 数 的 默认 大 小 (如 果 有 )。 





所 有 初始 化 参数 








总 ”上 一步 图 





完成 {E) ) 


26-58 Oracle 初始 化 参数 设置 
选择 “字符 集 ” 选 项 卡 ， 选 择 “ 从 字符 


字符 集 





Da 





I NY 


"E 


IM 











T 
字符 集 ， 则 Cognos 服务 将 无 法 局 动 成 功 )， 如 图 26-59 所 示 。 








列表 中 选择 ” 单 选 按钮 ， 然 后 在 “数据 库 
集 ” 下 拉 列 表 中 选择 “AL32UTF-8-Unicode UTF-8 通用 字符 集 ”， 在 “国家 字符 集 ” 下 拉 列 表 
中 选择 “UTF-8 - Unicode 3.0 UTF-8 通用 
v 


PE, JER CE8U-8”( 此 步骤 相当 重要 ， 如 果 不 


É:Database Configuration Assistant, W8 10( 共 12 步 ) : gib: 


加 回国 
E ASAN FER ERES 


一 数据库 字符 集 
C BARUA 





此 数据 库 的 默认 字符 集 是 基于 此 操作 系统 的 语言 设置 : ZHS16GBK。 
使 用 Unicode (AL32UTF8) 


将 字符 集 设置 为 Unicode (AL32UTF8) 就 可 以 存储 多 语言 组 。 
fe 从 宇 符 集 列表 中 选择 





国家 字符 集 : 





UTF8- Unicode 3.0 UTF-8 通用 字符 集 , 兼容 CESU-8 
默认 语言 : 简体 中 文 i 
默认 日 期 格式 : | 中 国 = 


所 有 初始 化 参数 .… | 








取消 | 帮助 ) 





< E-G) T-N > 完成 {E) ) 


图 26-59 Oracle 字符 集 设 置 
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单 击 “ 下 一 步 ” 按 钮 ， 进 入 数据 库 实例 的 存储 设置 ， 如 图 26-60 所 示 。 


É:Database Configuration Assistant, ?b9& 11( 共 12 步 ) : 数据 库存 博 


数据 库存 储 


从 梁 据 座 存 博 页 ,可 以 指定 用 于 创建 数据 库 的 存储 参数 。 该 页 显示 树 列表 和 概要 视图 (NR) 
以 允许 您 更 疏 并 查看 以 下 对 得 : 


* 控制 文件 
* 表 空 间 

* 数据 文件 
* 回 退 段 

* EAEE 


在 任 一 对 象 类 型 文件 来 上 ， 单 击 创 建 ， 以 创建 新 对 象 。 要 册 除 对 象 ， 请 从 对 象 类 型 广 件 来 中 选择 
FENS ARAMA- 


EEEH: 如 果 选 择 包含 数据 文件 的 数据 库 模 板 ， 将 无 法 添加 或 删除 数据 文件 、 表 空间 或 回 退 
段 。 选择 该 类 型 模板 允许 您 更 改 以 下 内 容 : 


”数据 交 件 的 目标 位 置 
*” 控制 立 件 或 日 志 组 。 


ghe] mS.) 文件 位 置 变量 .| 





取消 | 帮助 | EB 完成 (E) ) 





图 26-60 Oracle 存储 设置 


最 后 ， 进 行 数据 库 实例 的 创建 工作 ， 如 图 26-61 所 示 。 


Ē: Database Configuration Assistant, W8 12( 共 12 步 ) : 创建 选项 


选择 数据 库 创建 选项 ; 
(v 创建 数据 库 
一 [ 另存 为 数据 库 醒 板 


名 称 : [CoGNoss | 


说 明 : | 








一 [ 生成 数据 库 创建 脚本 





目标 
Hx: 





D3oracleiproducti 0.2.0:adminCOGNOSs!scripts pug... | 








$ 上 一 步 (B) Tiy 





图 26-61 Oracle 创建 设置 
单 击 “完成 ”按钮 ， 完 成 数据 库 实 例 的 创建 工作 。 
26.2.2 ”执行 建 表 空间 和 创建 数据 库 用 户 的 脚本 





人 # 创 建 表 空间 的 脚本 */ 

CREATE SMALLFILE TABLESPACE "COGNOS" DATAFILE 'D:ORACLF\PRODUCT\10.2.0\ 
ORADATA\COGNOS\COGNOS' SIZE. 200M LOGGING EXTENT MANAGEMENT LOCAL 
SEGMENT SPACE MANAGEMENT AUTO; 

IG EE FH P BALA = 

CREATE USER "COGNOS" PROFILE "DEFAULT" IDENTIFIED BY "COGNOS" DEFAULT 
TABLESPACE "BI ETL" TEMPORARY TABLESPACE "TEMP" ACCOUNT UNLOCK 

GRANT "CONNECT" TO "COGNOS" 

GRANT "DBA" TO "COGNOS"; 
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26.2.3 Cognos 部 署 设 置 


将 Cognos 服务 安装 上 日 录 下 “..\cognos\c8\webcontent\/” 的 内 容 全 部 复制 到 “..\cognos\c&\ 


webapps\p2pd\” 下 。 
26.2.4 ”配置 Cognos 服务 


“开始 ”一 “程序 ”一 “Cognos 8” 一 “Cognos Configuration", 启动 Cognos Configuration 





工具 ， 进 行 Cognos 服务 的 配置 和 局 动 ， 如 图 26-62 PR. 





Cognos Configuration 一 WW-CF63B08936C 
File Edit 


View Actions Help 








Eu Local Configuration 
G-[& Environment 
: 区 Cognos content database 
a- MA Logging 
-[g] Fie 
S} Cognos 8 service 
i 区 Cognos 8 
Portal Services 
日 -{ 晶 Security 
lig] Authentication 
i Cognos 
日 Cryptography 
Cognos 
Cognos Application Firewall 
G-[8 Data Access 
a Content Manager 











i ognos Content Store! 
Notification 
日 Cognos Planning 
Contributor Data Server 








Cognos Content Store - Database - Resource Properties 












Cognos content database 
localhost:1527 


六 冰冰 冰冰 冰冰 六 冰冰 站 冰冰 冰冰 


COGNOS 


Type 

** Database server and port number 
User ID and password 

** Database name 


Defines a group of properties used to locate an existing Cognos content database. 


Ensure that a Cognos Content database has been installed and configured with the same port. 











[Checking service status... 





| 26-62 “Cognos Configuration" TĦ 
首先 , 选择 “Environment” 选 项 ,在 右 侧 的 属性 里 ,选择 “Sort buffer size in MB", £t "Value" 





文本 框 中 输入 一 个 恰当 的 值 ， 








比如 “40”。 然后 选择 “Gateway URI”， 在 “Value” 文 本 框 中 





输入 “http://localhost:9300/ p2pd/servlet/dispatch”。 最终 修 改 好 的 配置 如 图 26-63 所 示 。 


mek) 





Cognos Configuration 一 WY-CF63B08936C 








File Edit view Actions Help 
Bibumi|ds,|? 
Explorer 






Bib Local Configuration 
&-[& Environment 
P [E Cognos content database 
Logging 
File 
Ej Cognos 8 service 
E B Cognos 8 
lits] Portal Services 
G- [B security 
lits] authentication 


a-m 


lg Cognos Application Firewall 
&-[& Data Access 

a Content Manager 
cognos 
lg Notification 
a lg Cognos Planning 
Contributor Data Server 














Environment - Group Properties 









..J deployment 
..Jdata 


Deployment Files location 
Data files location 


米 Map files location ..Jmaps 
Temporary files location .,Jtemp 
Encrypt temporary files? False 

** Format specification File location ..Jconfiguration/cogformat xml 
Sort buffer size in MB @ 40 


Gateway Settings 
米 Gateway URI 
Gateway namespace 
Allow namespace override? 
* Dispatcher URIs for gateway 
** Controller URI for gateway 
Dispatcher Settings 
** External dispatcher URI 
** Internal dispatcher URI 
Dispatcher password 
Other URI Settings 
** Dispatcher URI for external applications 
米 Content Manager URIs 
Font Settings 
米 Physical Fonts locations 
Physical fonts map 
Fonts to embed (batch report service) 
Fonts to embed (report service) 


Q http: //localhost:9300/p2pd/servlet/dispatch 


False 
http://localhost:9300/p2pd/servlet/dispatch/ext 
http://localhost:80/cognos8/controllerServer 


http://localhost:9300/p2pdjservlet/dispatch 


http://localhost:9300/p2pdjservlet/dispatch 
六 冰 米 冰 玉 六 冰冰 六 冰冰 六 冰冰 六 


http: //localhost:9300/p2pd/servlet/dispatch 
http://localhost:9300/p2pd/servlet 





Q ,binjfonts; CYWINDOWSYFONTS 
«click the edit button 
«click the edit button» 
«click the edit button> 


Specifies the URI to the gateway. 


The gateway must be located on the same computer as a Web server. If you are using ISAPI, change 'cognos.cgi' to 'cognosisapi.dll', If you are using 
apache mod, change 'cognos.cgi' to 'mod cognos.dll' on Windows, to 'mod cognos.sl' on HP UX PA-RISC, or to 'mod cognos.so' otherwise. Use the ' 
https' or 'http' protocol to select SSL or non-SSL communication. The host name portion of the gateway URI must be changed from localhost to an IP 
address or a network host name. 














图 26-63 
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“ Cognos Configuration" MWE 


其 次 ， 找 到 “Data Access" — "Content Manager" — “Cognos Content Store", 


Cognos Configuration 一 WWW-CF63B08936C 


Type 
| * Database server and port number | localhost:1527 
| User ID and password Cooketolekolootoletokelolook 





- ognos 8 service 
EH [m Cognos 8 
Portal Services 
B [8 Security 
: ee 
: [gj] Cognos 
| = Rb eros 
: -El Cognos 
d v- x Cognos Application Firewall 
&-[B Data Access 
LH me Content Manager 


Rename... 








图 26-64 MIER Cognos Content Store 


此 时 弹出 删除 提示 框 ， 单 击 “Yes” 按 钮 ， 如 图 26-65 所 示 。 


Cognos Configuration - WWW-CF63B08936C mE 











Cognos Content Store - Database - Resource Properties 
Local Configuration mme — 0 0 0 jJ ]Jee  — 0 0 0 0 1] 














G- [8 Environment Type |. Cognos content database 
Cognos content database |* Database server and port number | localhost: 1527 | 


















| User ID D and LM Cokololokolookotoletotookok 






8- [8 security 
i e k. Authentication 
i] cogos 

N- [^ Cryptography 

` [B] cognos 

Poo ET Cognos Application Firewall 
&-[B Data Access 

jd T conan liacle ad 


Cognos Configuration 


| A \ Are you sure you want to delete Cognos Content Store? 






= -E Notification 
à- W Cognos Planning 
L-. Ig Contributor Data Server 
















图 26-65 弹出 删除 提示 框 





Fat BUD 


删除 后 ， 右 击 “Content Manager", 27% “New resource" — "Database" MS, 3r£&—^4- 


数据 库 ， 如 图 26-66 所 示 。 
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Cognos Configuration 一 YY-CEF63B08936C 


pa Local Configuration 


T E Environment 
ll Cognos content database 











- Component Properties 
(Name — — — — — OO Je —— — 1] 


Save report outputs to a file system? | False 








I] Authentication 














i Ari Cognos Application Firewall 
& >E Data Access 


D Notification Reset to Default 


New resource i Database... 


图 26-66 Content Manager 创建 源 数据 库 
在 弹出 的 对 话 框 中 输入 名 称 和 类 型 ， 如 图 26-67 所 示 。 


Cognos Configuration 一 ¥EF-CF63B08936C 





EA Local Configuration 
e E Environment 
“| Cognos content database 





ognos 8 service 


: [m Cognos 8 
itg Portal Services 


-gg Authentication 
i [E] Cognos 


Wew Resource 一 Database 


i ac ESSE Application Firewall 
à- ts Data Access 


Notification 
Cognos Planning 
lt] Contributor Data Server 





图 26-67 New Resource 设置 


配置 完 之 后 ， 右 击 “Cognos”， 在 弹出 的 快捷 末 单 中 选择 “Test” 命 令 进 行 连接 测试 ， 
如 图 26-68 所 示 。 
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Cognos Configuration 一 WW-CE63B08936C 


Ema Local Configuration 


ca " 
Environment 
Cognos content database 












. Type 
WX Database server and port number 
User ID and password 








localhost:1521 
Egg n d a a g a a a a a | 














Cognos 8 service 

[m Cognos 8 

B lif] Portal Services 

&-[B security 

|. Eli Authentication 
i D] Cognos 













Gli] Content Manager 





i [gj 
: 而 | Notificatior Reset to Default 
a- Cognos Ple — nename... 

NE w Contrit Delete 





图 26-68 ”连接 测试 





如 果 测 斌 成功， 则 弹出 如 图 26-69 所 示 的 测试 提示 框 。 


Cognos Configuration 一 WWUY-CF63B08936C 


E S Environment Ty oracde data 
Cognos content database * Database server and port number | lecalhost:1521 
User ID and password | 六 站 站 站 站 站 冰冰 站 站 站 六 六 站 站 











Cognos Configuration 


di 


6- Content Manager 


a- Cognos Planning 
fg] Contributor Data Server 





图 26-69 ”测试 提示 框 


测试 通过 后 ， 请 保存 劳动 成 果 ， 如 图 26-70 Br. 
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Cognos Configuration 一 WWW-CF63B08936C 
File 
Ctrl+5 


TT cognos_oracle - Database - Resource Properties 
Export As... 


Exit Alt+F4 


a- Logging ser ID and passi 
B —[ü] File Service name 


* Database server and port number localhost:1521 





| Gl Cognos 8 service 


: [E Cognos 8 
: E Portal Services 
日 -时 security 
| ER Authentication 
&- lits] Cryptography 
: [gl] Cognos 
: [ri] Cognos Application Firewall 
G-[& Data Access 
a-m Content Manager 
[itg Notification 
ER Cognos Planning 
itg Contributor Data Server 








图 26-70 ”保存 设置 
保存 成 功 后 ，Cognos 显示 如 图 26-71 所 示 的 信息 。 


Cognos Configuration 一 WY-CF63B08936C 


Explorer cognos_oracle - Database - Resource Properties 

Ep Local Configuration 

G-[8 Environment 
Cognos content database 米 Database server and port number /—— lecalhost:1521 
Logging D and pass : 3 

] 米 Service name 





i-i c M Cognos Configuration 
i --[g] Cognos 
Git Cryptography 
| L-[] Cognos (ig 

: If Cognos Application Firewall 

G-[& Data Access 


i [i] 


Hif] Cognos Planning 
Hg Contributor Data Server 








图 26-71 设置 更 改 提示 框 
保存 后 ， 就 可 以 进行 Cognos 服务 的 启动 工作 了 。 
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26.2.5 Jia Cognos 服务 


Cognos 服务 的 局 动 有 两 种 方式 。 
1) 在 Cognos Configuration F, $h THER HS P 按 钮 启动 。 
2) 在 Windows 服务 中 ， 选 择 嘲 Comos 3 选项 局 动 。 








26.3 Cognos 入 门 实例 一 


本 实例 是 Cognos 的 初级 入 门 实例 ， 使 用 Framework 建 模 后 ， 直 接 在 Cognos Connection 
中 使 用 Report Studio 来 开发 一 个 人 简单 报表 。 
创建 数据 库 脚本 : 


create table PRODUCTS 
( 





ID VARCHAR2(32) not null, 

NAME VARCHARQ?2(100), 

TYPE VARCHAR2(2) 
^ 
create table REGIONS 
( 

ID |. VARCHAR2(32) not null, 

NAME VARCHARQ?2(100), 

TYPE VARCHAR2(2) 
); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0001', ' 红 木 家 有 具 ', '01"); 
insert into PRODUCTS (ID, NAME, TYPE) 
values (0002', ' 实 木 家 具 ', '025); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0003', ' 欧 式 家 具 ', 03); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0004', ' 中 式 家 具 ', '047); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0005', 'H pd x R.', '05); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0006', ' 地 中 海 家 具 ', 06"); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0007', 'IJ ZH", '07); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0008', 现代 家 具 ', '08*); 
commit; 
insert into REGIONS (ID, NAME, TYPE) 
values ('0000A', ' 上 昌平 , '02*); 
insert into REGIONS (ID, NAME, TYPE) 
values ('0000B', 昌平, '05*); 
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insert into REGIONS (ID, NAME, TYPE) 
values ('0000T', ' 西 城 , '06"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000H', ' 西 城 , '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000G', ' 通 州 , '02); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000F', ' 通 州 , '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000E', 海淀 , '07*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000D', 和 海 演 ', '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000C', 海 演 ', '04"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000M', ' 顺 义 ', '06*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000L', ' 东 城 , '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000K', ' 东 城 ', '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('00007', ' 东 城 ', '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000N', 顺义 ', '07*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('00000', "5 BH', '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000P', '=HBH', '02"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Q', '53 EH', '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000R', "ii EH", '04*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000S', i3] EH", '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000T', '3] EH', '06*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000U', '13] EH', '08*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000V', "A, '05*; 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000W', CK, '08*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000X', ^45", '06"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Y', ^45", '07); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Z', ' 延 庆 ', '04*); 


commit; 


insert into REGIONS (ID, NAME, TYPE) 
values ('0000V', 大兴 ',, '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000W', AX, '08*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000X', ^45", '06"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Y', ^48", 07; 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Z', ' 延 庆 ', '04"); 

commit; 


26.3.1 ”使 用 Framework 建 模 


1. 打开 Framework Manager 
Framework Manager 7 HUn A] 26-72 所 示 。 








Framework Manager allows yo 


l metadata and publish packages. 























图 26-72 Framework Manager 界面 


2. 创建 一 个 新 的 工程 
New Project 界面 如 图 26-73 Pr. 


New Project 





-Hew Project 
Project name: 
| 
[Sales 


| Location: 


| [p: \tempiSales j : 


m Project to be created 


| D:\temp\Sales\Sales. cpf 





Repository << | 


Repository settings 


| [| Add to repository 


|, Connection: 


Location in repository: 


|| ut 
e | mm | 


图 26-73 New Project 界面 
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单 击 “OK” 投 钮 后 ， 弹 出 创建 新 目录 提示 框 ， 如 图 26-74 所 示 。 


Framework Nanager 


A | | fu rb 








图 26-74 创建 新 目录 提示 框 
选择 语言 ， 如 图 26-75 所 示 。 


Select Language 


ENHA HR 
s70} 

这 

B 


ee T GT 353 CIC CL CC CC C C C G3 Là 
BE- 





图 26-75 ”选择 语言 
选择 数据 源 ， 如 图 26-76 所 示 。 


Netadata Wizard — Select Netadata Source 


Gi Cognos Architect (*.zml) 


[Mi]Cognos Impromptu (*.zml) 

Ba Cognos DecisionStream (*.zml) 
B Cognos 8 Data Manager (*.zml) 
(S) Thira Party Metadata Sources 





图 26-76 “元 数据 向 导 
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单 击 “Next” 按 钮 ， 弹 出 如 图 26-77 所 示 的 数据 源 问 导 对 话 框 。 


Netadata Wizard — Select Data Source 





Select a data source from the list defined in Cognos $, or create a new 


Hew... 





Help | Cancel | 





26-77 GRJ m 
新 建 一 个 数据 源 ， 如 图 26-78 所 示 。 


= New data source 
Welcome - New Data Source wizard Help 


The New Data Source wizard helps you create a data source and a first connection in the Cognos 8 server. It also gives 
you the option to test the connection and to create a first signon. 


You can dick back at any time to change your settings. 


Please click Next to start creating the data source. 





Cancel « Back Next » Finish 





图 26-78 创建 新 数据 源 问 导 
单 击 “Next” 按 钮 ， 开 始 创建 数据 源 ， 如 图 26-79 所 示 。 
输入 名 称 后 ， 单 击 “Next” 按 钮 ， 如 图 26-80 所 示 。 


ESI 


7 New data source 





= New data source bj 
Specify a name and location for this entry. You can also specify a description and screen tip. 
Name: 


[B1 SOURCE 


Specify the parameters for the connection of this new data source. The name of the data source is used to set the name 
of the connection. 


Type: 
Description: 


P. ^ 


Screen tip: 
[Bx souRcH 


| Oracle "| 
Isolation level: 

(€ Use the default object gateway 

(^ Specify a value: 


Cursor stability 





Location: 
Directory > Cognos 


Cancel « Back Next » Finish 








Cancel | « Back | | Next > || Finish | 





图 26-79 ”数据 源 名 称 及 描述 设置 图 26-80 数据库 设置 
选择 数据 库 类 型 ， 单 击 “Next” 按 钮 ， 进 入 数据 库 连 接 界 面 ， 如 网 26-81 Bp. 
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在 图 26-81 中 输入 数据 库 连 接 信息 ， 
界面 ， 如 图 26-82 Pp. 


7 New data source 


Specify the Oracle connection string - New Data Source wizard Help 


Edit the parameters to build an Oracle connection string. 
SQL*Net connect string: 
[cocnos 


Collation sequence: 


Signon 
Select whether a user ID and password is required in the connection string and, if so, whether to create a signon. 


[v User ID 
[v Password 


[v Create a signon that the Everyone group can use: 
User ID: 


[B1 SOURCE 
Password: 
Imm 


Confirm password: 


[eset 


Testing 


Test the connection... 


26-81 ”数据库 连接 





单 击 “Test the connection” 按 钮 ， 进 入 数据 库 测 试 


= New data source 


Test the connection - New Data Source wizard Help 
Test the parameters that make up the database connection, 


Connection string: 
^User ID:^?Password:;LOCAL;OR;ORACLE@%s@COGNOS/%s@COLSEQ= 


Ces 


Dispatcher: 
http://liugf:9300/p2pd (Configuration) 





Test the connection using: 
User ID: 


[Bx soURcE 


Password: 


[eoo 





26-82 数据库 测试 


单 击 “Test” 按 钮 ， 进 入 数据 库 测 试 提示 信息 界面 ， 如 图 26-83 所 示 。 


-m New data source 


View the results - Test the connection Help 


| -> Name | Status 
He -> http://iugf:9300/p2pd Succeeded 


| Message 





26-83 
测试 成 功 后 ， 返 回 数据 库 连 接 信息 界面 ， 


zm Hew data source 








数据 库 测 试 提示 信息 


如 图 26-84 所 示 。 


Edit the parameters to build an Orade connection string. 


SQL*Net connect string: 


[cocnos 


Collation sequence: 


Signon 


Select whether a user ID and password is required in the connection string and, if so, whether to create a signon. 


JV User ID 


[v Password 


[v Create a signon that the Everyone group can use: 


User ID: 


[B1 soURcCE 


Password: 


Im - N 


Confirm password: 


Im XN 


Testing 


Test the connection... 





| Cancel | | < Back | | Next > | Finish 











26-84 ”数据 库 连 接 信息 
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单 击 “Next” 按 钮 ， 结 果 如 图 26-85 所 示 。 


7 New data source 


Specify the commands - New Data Source wizard Help | 


Specify the commands that the database executes when certain events occur. 








Entries: [1 -上 ©| | me 








ear 








图 26-85 数据库 执行 设置 
单 击 “Finish” 按 钮 ， 结 果 如 图 26-86 Pp. 


-m New data source 


| 
| 


The New Data Source wizard successfully created a data source and a first connection in the Cognos 8 server. 





图 26-86 ”数据 源 完成 向导 
在 图 26-87 中 ， 选 择 要 建 模 的 表 ， 然 后 单 击 “Next” 按 钮 ， 进 入 元 数据 向 导 ， 如 图 26-88 
所 示 。 


Netadata Wizard — Select Data Source 


me [8] BI SOURCE 
-ae BI_SOURCE 
| Ej Miu 





图 26-87 ”数据 源 向 导 界 面 图 26-88 KIZ 


342 


Ah “Import” Ji, RUK 26-90 PZR. 


Netadata Fizard 一 Generate Relationships | | Netadata Wizard — Finish 


FS OECD c5 


Relationships are created for rou during the import of your data. 
Select the criteria to use to generate relationships. - 
Completed the import process. 


Select at least one criteria to detect and generate relationships. Ct Eo ea aoi 
f : Type: Query Subject, Count: 2 
[w Use primary and foreign keys: 


+ 


厂 Use matching query item names that represent uniquely indered 
columns 


[ Use matching query item names 


Select between which set of objects rou want to detect and generate 
relationships. 


(* Between the imported query subjects 


Between each imported query subject and all ezisting query 
subjects in the model 


C Both 
Indicate how rou want to generate relationships between the imported 


query subjects. 
Üuter joins: 


Iè Comwavt ta innar inin [1 nl 


Help | Cancel | < Back Finis! | Help | Cancel | 














图 26-89 ”元 数据 问 导 图 26-90 ”元 数据 成 功 导入 
单 击 “Finish” 按 钮 ， 就 创建 好 了 一 个 工程 ， 如 图 26-91 PTR. 


-= Sales #4 一 Framework Nanager 





| File Edit View Project Repository Actions Tools Help 


D|B H| Awr cx | $ Bh A X | E-men 


























4mPack Forward | t E | Sales 
| Project Viewer [105€ || Tools Dx 
日 a Sales B Sales | = Summary 名 Search 总 Dependencies 
= BI SOURCE [ ; CR 
E E »1- Select an object to view its dependencies 
ZW PRODUCTS | 
We BI_SOURCE 
NAME 
1 2 二 Drag & drop an object from the Project 
T TYPE s= Explorer 3? Diagram 四 Dimension Map Viewer here to View te dependencies 
- Wy REGIONS E dh SN IS 
WW) 1» Data Sources 
[I] rae 
(I TYPE 








由 f Data Sources 
由 Parameter Maps 
[frt Packages 


Parameter Maps 


Packages 


& 加 c 





| Dependent objects 











Properties - Bx No Dependencies Found 


Properties | Language 


Hame Sales 
| Languages «Click to edit.» 
Design Language en 











| [T Show Object Id 











26-91 Framework Manager 界面 


3. 建 模 过 程 
在 导航 视图 中 选择 刚刚 导入 的 数据 库 表 ， 然 后 在 表 属 性 窗口 中 设置 一 系列 参数 ， 比 如 名 
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BK. HE SARTA DAS. UK 26-92 Pin. 


ES Sales * 一 Framework anager 











E) 





| File Edit View Project Repository Actions Tools Help 
IDIS H| Amio cx | $ ga AX | E (E SU 
| Back hForsard | t F les | 








日: Ros Summary & Search & Dependencies | 
T E E 
c Wm PRODUCTS Select an object to view its dependencies 
(J| 1p BI SOURCE 
M save T | 
. TYPE Ha | rag & drop an object from the Project 
à 3 W rs Explorer à? Diagram 四 Dimension Map Viewer here to view its dependencies. 
qr m Data Sources 
M) za 


一 四 TYFE 


e (£l rata Sources 
[Ej] Parameter Maps 
(all Packages 


Parameter Maps 


Packages 


Dependent objects 


Properties No Dependencies Found. 
Properties | Language | 
Hame PRODUCTS 
Description | 
Last Changed 2007-05-25T111:24:54 
Last Changed Br Anonymous 
Model Comments | 
Screen Tip 
Security Filters |«Click to edit. > 
Externalize Method default 
Externalize iuto Summary false 
Status Valid 






































26-02 表 属 性 设置 





设置 完 表 属性 之 后 ， 接 下 来 需要 设置 字段 属性 。 同 样 ， 字 段 属 性 可 以 设置 名 称 、 描 述 、 
格式 、 类 型 、 大 小 、 是 否 为 空 等 ， 如 图 26-93 所 示 。 


-. Sales * 一 Framework Nanager 












| File Edit View Project Repository Actions Tools Help 

|D S H| Amr ro | € Rs Ax] ES [|] EG 

| 4mBack  "hForward | t T | Sales ee 
. £ Summary fa Search && Dependencies | 













[RS] B1. sovacE 
E m PRODUCTS 
-M m 
-M 产品 名 称 
-i TYPE 


B- i REGIONS 


BI_SOURCE 


Drag & drop an object from the Project 


站 : 
i- Explorer $ Diagram 四 Bmersor Map Viewer here to view its dependencies. 





Data Sources 


H- $e Sources 
Parameter Maps 
tO Packages 


Parameter Maps 


Packages 





Properties 





Properties | Language 


Hame 产品 名 称 

Description 
| Last Changed 2007-05-25T11:28:13 

Last Changed By Anonymous 

Model Comments 
Sereen Tip — — B 

External Hame —/ NAME 

Is Hidden false 

Usage Attribute 

Format «Click to edit. > 





Dependent objects 








No Dependencies Found. 











Currency i PME 
Data Type Character Length 16 
Precision 100 














Size E 

Is Hullable 
Display Type 
MIME Tyg v 

















zn O m 





26-93 ”字段 属性 设置 
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设置 完 属 性 之 后 ， 导 航 视 图 中 显示 的 属性 信息 如 图 26-94 Bran. 


-oe Sales + — Framework Nanager 











| File Edit View Project Repository Actions Tools Help 


[DIS H| Awo co | 3 e Ax |E [RR LG 
| 和 Back "hForward | t T | Sales 








Sales 
cR] BI SOURCE 
| Eg PRODUCTS 











t Summary fa Search & Dependencies | 


Select an object to view its dependencies 


-M 1 BI_SOURCE 
l sen Drag & d bject from the Project 
j sz E rag & drop an object from the Frojec 
: | y xz = Explorer "E" Diagram 四 Dimension Map Viewer here to view its dependencies. 
| [MI 上 Data Sources 
LESE 
TEES 


Parameter Maps 


Packages 








Properties 


Properties | Language 
Hame REGIONS : 
Description Dependent objects 
Last Changed 2007-05-25T11:29:50 


Last Changed By Anonymous "n mo 
Model Comments o Dependencies Found. 

















Screen Tip 
Security Filters <Click to edit. > 
Externalize Method iqd 
Externalize uto Summary false 

Status Valid 


























26-94 属性 信息 


然后 开始 设置 关联 关系 ， 单 击 “Diagram” 选 项 连接 ， 在 打开 的 窗口 中 显示 刚刚 建立 的 数 
据 库 业 务 模 型 结构 ， 如 图 26-95 所 示 。 


2 Sales * 一 Framework Nanager l- efx) 
| File Edit View Diagram Froject Repository Actions Tools Help 
JB B H| Hmo o | € 8m Ax |E [DN 
| 知 Back mri | d F |s > rrcsover —— [AR | & 10s - E] XE 2£ | C5 5 iib. à 

iz Explorer qe Diagram | 四 Dimension Map | Tools [gx 
Bm. Sales Summary & crarch & Imo | 


ci BS| BI. SOURCE Select an object to view its dependencies 


| Egg] PRODUCTS 
i REL DD 







ij PRODUCTS A imi REGIONS A 


Drag & drop an object from the Project 
Viewer here to view its dependencies. 








&- e Data Sources 
H-E Parameter Maps 
m f Packages 





Properties Ee 
Properties | Language | 
Hame BI, SOURCE 
Description 
Last Changed 2007-05-25T11:25:03 
Last Changed Br Anonymous 
Model Comments 
Screen Tip 





Dependent objects 











No Dependencies Found. 




















un 一 一 





26-95 数据库 业务 模型 结构 
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HT BRHBE X|9Ee" g E, RJE PRODUCTS 5j REGIONS 之 间 画 一 条 连接 线 ， 
此 时 弹出 关联 关系 设置 对 话 框 ， 如 图 26-96 所 示 。 


Relationship Definition 一 PRODUCTS <--> REGIONS 





图 26-96 “关联 关系 设置 ”对 话 框 


选择 PRODUCTS 的 “类 型 ”与 REGIONS 的 “产品 类 型 > 关联， 然后 单 击 “确定 ”按钮 。 
建立 好 的 关联 关系 如 图 26-97 Wr. 


es — Framework Crus 


Drag & drop an object from the Project 
Viewer here to view its dependencies. 














图 26-97 业务 数据 关联 结构 
然后 单 击 “ 保 存 ” 按 钮 国 ， 如 图 26-98 所 示 。 
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72 Sales 一 Framework Manager mex) 
| File Edit View Diagram Project Repository Actions Tools Help 


| D| e H|| Mund ka | $ Bs A X | 国 - man 
| qm 中 rvs | f Bee ， nome [x] & ws B dE 2C| Ch BB RE G 
| Project Viewer — — D X| i Explorer ge Diagram | 四 Dimension Map | ETE 


tf Summary f Search 总 Dependencies | 
Select an object to view its dependencies 










mi PRODUCTS A ji REGIONS A 
ID 


Drag & drop an object from the Project 
ID Viewer here to view its dependencies. 


-6 Data Sources Framework Manager 
=- Parameter Maps 
(gl) Packages 


Saving model 


Properties | Language | 


^ Hame [PRODUCTS <--> REGIONS l . 
| Expression «Click to edit. > | Dependent objects 
. Status 0 [ralia 


No Dependencies Found. 








26-08 ”保存 设置 


至此， 使 用 Framework 建 模 的 过 程 全 部 完成 。 

4. 创建 包 及 发 布 模型 

模型 创建 好 之 后 ， 接 下 来 束 是 发 布 模型 的 过 程 了 。 

在 导 轩 视图 窗口 中 ， 石 击 “Package”， 在 弹出 的 快捷 末 单 中 选择 “Create” 一 “Package” 
命令 ， 如 图 26-99 所 示 。 


7i Sales 一 Framework Nanager 








EREJES 





| File Edit View Diagram Project Repository Actions Tools Help 


[DIS H| Amio ee | € e Ax |E [|n vg 
| Back DForward | 会 F |[sales rpsowaer o |[R | & 10s - B JE 2£ | C5 Rb ii tá 


Ep Explorer qe Diagram | 四 Dimension Map | Tools SL 
oA sales fj Summary fa Search 总 Dependencies | 
c [RS] 51. sovace 


OR B promucrs Select an object to view its dependencies 
| UE PRODUCTS A ii REGIONS A 


Drag & drop an object from the Project 
Viewer here to view its dependencies. 


Switch to View 


va Verify Selected Übjects... 
5| Run Model Advisor. 
& Show Object Dependencies... 


Cut Ctrl+X 
Copy Ctrl+C 
FA Paste CtrltV 
Delete Del 


No Dependencies Found. 


Rename 


Select All Similar Übjects 








Package [ maf 


26-99 ”创建 包 
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输入 发 布 包 的 名 称 及 相关 描述 ， 如 图 26-100 所 示 。 





输入 完成 后 ， 单 击 “Next” 按 钮 ， 弹 出 需要 发 布 的 模型 ， 如 图 26-101 所 示 。 


Create Package 一 Provide Name Create Package 一 Define objects 


Hame: Define the objects you want to include in this package 


产品 甫 此 区 域 


g^ Using existing packages 
Description: 


HAREE H 


í* From the project 


-wr| PRODUCTS 
由 - v |- RESONS 


Screen tip: 


i 


Help | Cancel | Finish | Help | Cancel | Finish | 
K| 26-100 包 名 及 描述 设置 图 26-101 需要 发 布 的 模型 
选择 完 之 后 ， 单 击 “Next” 投 钮 ， 弹 出 可 用 的 一 系列 功能 集 ， 这 里 选择 “Oracle”， 双 击 
右 侧 的 “Oracle” 添 加 到 左 侧 区 域 ， 如 图 26-102 所 示 。 
单 击 “Finish” 按 钮 ， 完 成 包 的 创建 。 
包 创 建 完 成 之 后 , 系统 弹出 是 否 打开 发 布 包 癌 导 的 提示 框 , 如 图 26-102 PTR. fat; ^ Yes" 
按钮 ， 弹 出 发 布 包 癌 导 对 话 框 ， 如 图 26-103 所 示 。 





Select the set of functions that will be available in this package. 


Available function sets: Selected function sets: 


AmericaFire * — Framework Nanager 


You have successfully created your package. 
Would you like to open the Publish Package wizard? 


Define Quality of Service | 
Help | Cancel | < Back | Hext > | [ginis | 
LA 








图 26-102 IHRER 图 26-103 是否 打 开发 布 包 问 导 提示 框 
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在 Cognos 8 Content Store. 下 的 列表 中 , 选择 要 发 布 到 的 本 地 目录 ， 以 便 在 Cognos Connection 
中 打开 该 模型 制作 报表 。 单 击 “Next” 按 钮 ， 进 入 安全 设置 界面 ， 如 图 26-105 所 示 。 


Publish Wizard 一 Select Location Type 


Publish Wizard 一 Add Security 


zn dé gi =A dd K 


— Select publish location 


User Access | Administrator Access | 


Specify access permissions for Ta package. These settings are only 
available on the initial publi 
Folder location in the Content Store: 


Selected groups and roles will be able to use this package to create 
as] | reports 
[€ Enable model versioning 


Number of model versions to retain (enter 0 for unlimited versions) 


[Cognos Role —  [Psth | 
0 


Ho security defined 


[ Delete all previous model versions 
(C Location on the network 
letvork location 


New... 




















< Back Cancel | < Back Cancel | 
7 D 


图 26-104 Agen 图 26-105 ”安全 设置 
暂时 不 进行 设置 ， 直 接 单 击 “Next” 按 钮 ， 进 入 发 布 前 的 验证 设置 ， 如 图 26-106 所 示 。 
设置 完成 后 ， 单 击 “Publish” 按 钮 完成 发 布 ， 如 图 26-107 所 示 。 


Publish Wizard 一 Options 





Ezxternalized query subjects 








You have successfully published the package to the following location 
[ Generate the files for erternalized query subjects 


Directory > Cognos > Anonymous > Mr Folders > F5 EEG 
Network location: 








Do rou want to: 


(* Exit this wizard 
Click Publish to publish rour package. 


(C Publish another package 





Ihe following groups have administrator access to the package 


Directory Administrators [Directory > Cognos] 


Launch Cognos 8 | 


Help | 











< Back | Publish | Cancel | 





图 26-106 ”验证 设置 图 26-107 SE A 


26.3.0 ”使 用 Report Studio 制作 报表 








登录 http://localhost:9300/p2pd/servlet/dispatch 网 址 ， 然 后 单 击 右上 角 的 “Launch”， 在 弹 
出 的 下 拉 列 表 中 选择 “Report Studio” 选 项 ， 如 图 26-108 所 示 。 
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C Ey Folders 一 Cognos Connection 一 Windows Internet Explorer 





XQ) RHE E) KERA IAM $8500 


Go v [E] http://localhost:8300/p2pd/servlet/dispatch?b action-xts.run&m-portal/cc.xtsám tab-i6TBBG38EEB142C? V | 4+ | X | Pp- 


D dr EB |» | B ty Folders - Cognos... X [Bheport Studio e iwl hi æ z i Ame ~ IA - K 


I 
(fitv Public Folders My Folders bN Query Studio 
i @ Analysis Studio 
My Folders HiO B S lb. Report Studio 
@ Event Studio 

1 
E K& Drilthrough Definitions 



















Cognos Connection 





















O| [Namee | Modified $ 
O dp 产品 销售 区 域 May 25, 2007 11:41:05 AM 





Poey23m» 


成 @ Internet 9 100% ~ E- 


= 
Zu 


26-108 Cognos Connection 界面 


在 跳 转 的 界面 中 选择 刚才 发 布 好 的 包 “ 产 品 销售 区 域 ” 如 图 26-109 所 示 。 





Select a package (Navigate) 一 Windows Internet Explorer 


THO 编辑 区) SAU KEKA IA RAD 








Go v || http: //localhost:9300/p2pd/servlet/dispatch v 全 | [x] rim 


3 d EMG Folders - Cognos Co... (Esaeet a package (N... X [E roort Studio | | e z y = d s mo z JO IAO0 HEN 


Select a package (Navigate) Help 


Search 























Select which package to use. 


Recently used packages: 
产品 销售 区 域 














List of all packages: 


Coanos > My Folders Entries: Fr - 1 ] © 41« Dy [> 
| Name $ 
an 产品 销售 区 域 ~ 





| | | | Q Internet 9 100€ ~ E 


dil 
E 





26-109 包 向 导 


直接 单 击 链接 ， 首 先 加 载 ， 如 图 26-110 rn. 
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— Windows Internet Explorer 





THEO AHD SEVU kka IA 和 助人 H) 
P mms. amm = 
€» € Y ie http://localhost:9300/p2pd/pat/rsapp. htm 


w d esie Public Folders - Cogno... e x I] 














me[x[ss eR 
A- DD &-imED-OQIAO-" 











Initializing ... 





9 Internet 


26-110 ”加 载 界面 


加 载 完 之 后 ， 进 入 Report Studio 的 欢迎 界面 。 在 该 界面 中 ， 单 击 “Create a new report or 
template” 按 钮 创建 一 个 新 报表 ， 如 图 26-111 rn. 


Report Studio 一 Windows Internet Explorer 





THO AHO SEVU KERA IA FRH) 


QO- Birma 上 oggEe Ia 


w L1 88|* Æ Plie Folders - Cogno... e Report Studio x | 


File Edit View Structure Table Data Run Tools Help 











A- D- &-255D0-GIAO-" 
| 
D Hissgiemxiooeii&mb-(ülb-i€-tistirt-4u-rz- Brinascsmóm:? 


ujeessinHiHisé-i4-—[r-:m8-iB- Exii5-£sixiv-vu 


ua: 














Idx3 sa6ed 而 


4340| 








Choose an option: 
3 | Create a new report or template 


| Open an existing report or template 


MM Show this dialog in the future 








完成 


Internet | &i100$ ~ ,; 


26-111 Report Studio 欢迎 界面 
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E IRRA H, w "List" AW, Aarh “OK” H, WE 26-112 Bn. 


BEE 


Report Studio 一 Findows Internet Explorer 
wO AHD EEV RERA IAM 帮助 0 
Tm 4 — 
SAZ v E| http: //1ocalhost:9300/p2pd/pat/rsapp. htm (#7 |X| | 百度 | Pi 


3 * eke Public Folders - Cogno... le Report Studio x [一 A ta M a V Es muc = GIAO z K 


File Edit View Structure Table Data Run Tools Help 
DEH Xinagil 国 四 >》 Bte ti 但 -i 了 外- a o e a aD img? 
[e 人 -ia z vi& BEARRA- -i2 —- [e E-m € gi - mb xnl v 
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oldx3 abed [in] Atl 





| New ia X| 


Package: 

BEERE [| 

[1] E] F 
Blank 
E E] 8G 


Repeater Table Report Template Existing... 























图 26-112 ”创建 模式 向 导 
进入 Report Studio REFRA, "lE 26-113 PZR. 


Wew — Report Studio —- Windows Internet Explorer 


ZED uc SEV RW IAD WEQ 
Jex] [ss eH 


ONTEN, s 
e» € v E) http: //localhost:9300/p2pd/pat/rsapp. htm 
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Ja4oldx3 a6ed [y 


(KD 

ab 产品 名 称 

ar 类 型 
SW] REGIONS 

(D 

(E 地 区 名 称 

国 | 产品 类 型 


^ Drop items here to create new columns 








26-113 Report Studio 报表 开发 界面 
拖 住 左 边 Insertable Objects 工作 区 内 的 表 PREGIONS 中 的 “地 区 名 称 ” 列 到 右 侧 的 表格 
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中 ， 如 图 26-114 所 示 。 








New* — Report Studio — Windows Internet Explorer 
wO AHE SEV KEKA IAM)  $SB500 
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File Edit View Structure Table Data Run Tools Help | 
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JaJoldx3 sa6ed Mo 


^*« Drop items here to create new columns 











图 26-114 页面 布局 图 
同样 ， 将 “产品 类 型 ”和 “产品 名 称 ” 列 拖 入 右 侧 工作 区 。 最 后 的 效果 如 图 26-115 所 示 。 


New* 一 Report Studio 一 Windows Internet Explorer 
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< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > | < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 


(E 地 区 名 称 
a 产品 类 型 











完成 Internet $1008 * . 


图 26-115 报表 设置 界面 
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报表 列 设 计 好 之 后 ， 设 计 报 表 名 称 ， 双 击 “Double click to edit text”， 在 弹出 的 “Text” 
对 话 框 中 输入 “产品 销售 区 域 ”” 然后 单 击 “OK” 按 钮 ， 如 图 26-116 所 示 。 





New+ — Report Studio — Findows Internet Explorer 
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(M 类 型 < 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 

c Wi REGIONS 

(M. 7 
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完成 Internet 


26-116 ”设计 报表 名 称 
役 计 好 的 标题 如 图 26-117 所 示 。 


Hew* — Report Studio — Windows Internet Explorer 
wO RED SEVU RERA IA 帮助 加 
or 

http: //localhost:9300/p2 h v*sx| | 百度 p 
KJ rn ttp: //localhost /p2pd/pat/rsapp. htm ll | | | | 
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< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 

















完成 Internet 1008 -* ,,; 


26-117 报表 界面 
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接 下 来 ， 将 “产品 名 称 ” 列 分 组 显示 。 首 先 选中 “产品 名 称 ” 列 ， 然 后 单 击 工具 栏 中 的 
“Group / Ungroup” 投 钮 ， 如 图 26-118 所 示 。 





























.3 kd Internet Explorer mE] 
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[M] 2l < 产品 类 型 > < 产品 名 称 > 
A aod < 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
DESS < 地 区 名 称 > | < 产品 类 型 > | < 产品 名 称 > 
S- Wl] REGIONS 
(m 
[如 地 区 名 称 
国 产品 类 型 

















日 Conditional 
| Conditional Styles 
| Style Variable 


| Text Source Variable 

















图 26-118 分 组 设置 
列表 “地 区 名 称 ” 中 将 多 出 一 个 图 标 ， 如 图 26-119 所 示 。 
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CFRE | PREIS 


R> < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 


c Wl REGIONS 
(D 
[| 地 区 名 称 
a 产品 类 型 

















Internet «100 - 


图 26-119 分 组 图 标 


接 下 来 ， 选 中 空白 区 域 ， 单 击 工 具 栏 中 的 “Center” 按 钮 将 表格 居中 显示 ， 如 图 26-120 
所 示 。 
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New* — Report Studio — Windows Internet Explorer 
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国产 品类 型 





























图 26-120 ”居中 显示 表格 
人 至此， 报表 基本 上 就 设计 完成 了 。 
26.3.3 ”查看 报表 


报表 设计 完 之 后 ， 就 可 以 查看 报表 了 。 单 击 工具 栏 中 的 “Run Report” 按 钮 ， 系 统 将 以 报 
表 的 方式 显示 刚才 完成 的 设计 ， 如 图 26-121 Br. 
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日 Conditional E 
Style Variable 

加 Box Y 

完成 


图 26-121 运行 报表 
报表 显示 如 图 26-122 所 示 。 
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Cognos Viewer — Windows Internet Explorer 
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Cognos Viewer 图 
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产品 销售 区 域 
东城 01 红木 家 具 
03 欧式 家 具 
05 田园 家 具 
AX 05 田园 家 具 
08 现代 家 具 
平谷 06 地 中 海 家 具 
07 时 尚 家 具 
延庆 04 中 式 家 具 
昌平 02 RRRA 
05 田园 家 具 
朝阳 01 IRRA 
02 RERA 
03 欧式 家 具 
04 中 式 家 具 
05 田园 家 具 
06 地 中 海 家 具 
08 现代 家 有 具 
HUE 04 中 式 家 具 
05 田园 家 具 
07 时 尚 家 具 
May 25, 2007 1 1:24:02 PM 
Z Top 会 Page up Y Page down X Bottom 
完成 €» Internet * 100€ ~ 





K| 26-122 报表 展示 图 





经 过 以 上 步骤 的 练习 ， 读 者 已 经 对 Cognos 报表 制作 的 流程 和 工具 的 使 用 有 了 初步 的 认 
识 。 在 26.4 节 中 ， 将 介绍 Cognos 的 男 一 个 入 门 实例 。 


26.4 Cognos 入 门 实例 二 


经 过 上 和 面 的 简单 入 门 实 例 ， 读 者 已 经 大 概 蜗 悉 了 Framework 建 模 工具 的 使 用 ， 以 及 使 用 
Report Studio 制作 报表 的 步骤 。 在 本 节 中 ， 将 使 用 Transformer 立方 体 建立 多 维 模型 ， 然 后 使 
用 Analysis Studio 来 制作 多 维 分 析 报 表 。 


26.4.1 {EH Framework 建 模 
1. 创建 数据 库 脚本 


create table SALES 
( 
id varchar2(32) not null, 
product name  varchar2(100), 
produtct type  varchar2(100), 
region name varchar2(100), 
dates date, 
amounts number 
); 
insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 
values ('8381918e2f9bcf3a013044fb7b5a027e', '"WX3X 2x His '03', "SHEH', 780, to date(13-05-2010, 
'dd-mm-yyyy)); 
insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 
values ('8381918e2f9bcf3a012ffbf7b4610063', 'Hü rpiRjzk H.', '06', '^ 2$, 26, to date(18-11-2009', 
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'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8a81918e2f0bcf3a012ffbe57a19005f, 'IAZKZK H.', '08', 'AXE', 263, to date(20-05-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8a81918e2f9bcf3a012ffbcb3fal005d', 'HÀU[V ZX H.', '05', "CX, 485, to date(31-08-2009', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8381918e2f9bcf3a013044f2c43e027c', 'SE7K ZX R.', '02", 'SHEH', 88, to date('01-10-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values (8381918e2f9bcf3a013044123c73027b', 'ZEZK ZX FU, '01' 8] [H', 1080, to date(31-12-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, 
DATES) 

values ('8381918e2f9bcf3a012ffc04955e006d', "SLT ZE EU, 05 '¥HBH', 956, to date(01-01-2011', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8a81918e2f9bcf3a012f1:0072870069', 'SEZK ZK H', '02', ' EPE', 354, to date(01-05-2011', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8a81918e2f90bcf3a012ffbfdd4520067', ' 中 式 家 具 '，'04', '4EJK', 261, to date(15-09-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8381918e2f0bcf3a012ffbfa4d7d0065', ' HF M zx Ry 07, ' 平 谷 '，182,，to date('20-05-2009', 
'dd-mm-yyyy")); 

commit; 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8481918e2f9bcf3a012ffbbe5a250059', ' H pd ZX H.', '05', ' ZR D', 820, to date(21-07-2011', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values (8281918e2f9bcf3a012fd3d0b3f00040', "WX SX X HL, '03'; "ZR JA', 366, to date(22-11-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8281918e2f9bcf3a012fd3cdb10f003d', 'ZLZK ZX Hy, '01', 'ZR3IX',, 452, to date(10-05-2011', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('8381918e2f9bcf3a013044fb8e2c027f, 'H pd Z&.H.', '04', "SSH BH', 1823, to date(30-09-2009', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values (8a81918e2f9bcf3a0130450794590282', Bf ZX Hi '05', 'SF', 652, to date(16-10-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('870c773a549a49e3acd2d6da426c0260', ' 地 中 海 家 具 ','06', "SHBH', 462, to date('20-12-2010', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values ('d680c1c5b0534a81aa0ed0331f8b6f17', "PR ZX H.', '04', 'FVE', 116, to date('20-03-2009', 
'dd-mm-yyyy")); 

insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 

values (55b936a7a65c43ab95150f3c793c2ddf, "BLUT Zx Hi '05', 'IREDE', 286, to date('01-04-2009', 
'dd-mm-yyyy")); 
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insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 
values (4a478c724f314cc3b074d8f93718bb80e', 'I jj zx HL, '07, "ifiuE', 450, to date(31-01-2010', 
'dd-mm-yyyy?); 
insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, DATES) 
values ('f80808132810e4901328f47b0340032', "EAZKZK H.', '08', "3H BH', 295, to date('01-10-2010', 
'dd-mm-yyyy?); 
commit; 


2. 新 建 一 个 项 目 
新 建 项 目 同 导 如 网 26-123 所 示 。 


[3 Mu qne 


Jew Project 


Project name: 


[Sales2 


Location: 


PD:\temp\sales2 CS | 





rProject to be created 








D:NtempiSales2*Sales2. cpf 


Repository << | 


-Repository settings 








r Add to repository 


Connection: 
| | £N 
hd 1^3 
X, 


Location in repository: 











Cancel | Help | 
图 26-123 ”新 建 项 目 向 导 











数据 库 表 使 用 上 面 SALES 表 。 
导入 数据 库 的 过 程 和 建 模 过 程 在 26.3 节 中 已 经 介绍 了 ， 这 里 就 不 再 袭 述 。 创 建 好 的 模型 
及 发 布 的 包 完 成 后 ， 如 图 26-124 所 示 。 
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| File Edit View Diagram Project Repository Actions Tools Help 
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roject Viewer $2 Explorer ge Diagram | 四 Dimension Map | Tools Bx 
tfj Summary 名 Search 总 Dependencies 
| Select an object to view its dependencies 
Dra he Pr 
2 | ] ndene 
= (a) Packages 
SG LLL 
| [ Dependent objects 
E 二 H 
Propert Ex N und 
Properties | Lan 
Hame 产品 销售 区 域 2 ^| 
Description 
Last Changed 2007-05-25T14:46:11 | 
Last Changed By Anonrzmous | 
Model Co nt | 
Screen Tip | 
Last Published 2007-05-25T14:46:11 | 
Last Publish Location Directory > Cognos > Anonrmous > My ... | 
Max Versions 0 
Languages «Click to edit. > j 
下 ps3» Definition Click to edit. > " 
| Is Bole Based false 图 || LI Show Object Id 











出 
z 
| 


图 26-124 模型 图 


了 92 


其 中 ， 需 要 注意 的 一 点 是 : 将 模型 SALES 的 Externalize Method 属性 值 设置 为 .ijqd， 并 设 
置 保 存 的 .iqd 路 径 ， 然 后 再 进行 发 布 ， 如 图 26-125 所 示 。 
Publish Wizard 一 Options 
T 
"— NN 


Externalized query subjects 


J” Generate the files for ezternalized query subjects 


Network location: 
D:itempiSales2 


[V Verify the package before publishing 


Click Publish to publish rour package. 


EIN 
a 





26-125 发布 向 导 


26.4. ”使 用 Transformer 立方 体 多 维 建 模 


1. 3 Transformer 多 维 模 型 
打开 路 径 : 选择 “开始 ”一 “程序 ”一 “Cognos Transformer” 一 “Transformer” 命 令 ， 
如 图 26-126 所 示 。 





File View Security Help 


|DBH&|o42xu-o|m|mEg:uecj. 








26-126 Transformer 界面 
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单 击 工 具 栏 中 的 品 按 钮 新 建 一 个 模型 ， 弹 出 如 图 26-127 所 示 的 对 话 框 。 





File Edit View Run Diagram Tools Security Window Help 





|DGH&lo-4xu-oj|E|EEuxC|Ó 


Ill Dimension Eap 


而 Data Sources mE I 





mb |< —-o0|[r—£o »] 





26-127 新建 模型 向 导 


单 击 “ 下 一 步 ” 按 钮 ， 输 入 模型 名 称 ， 如 图 26-128 所 示 。 
输入 模型 名 称 后 ， 单 击 “ 下 一 步 ” 按 钮 ， 进 行 数 据 源 和 数据 类 型 的 设置 ， 如 图 26-129 所 示 。 


Please enter a name for your model. Please enter the name and the type of your 
! « data source. 


Model name : j Data source name: 


[Sales sales 


Data source type: 


Impromptu Query Definition 





m | <+- |T- | Help | mb | “上 一 步 @) | 下 =- 步 中 | 
图 26-128 输入 模型 名 称 图 26-129 设置 数据 源 和 数据 类 型 
^: “Data source type” 下 拉 列 表 中 ， 选 择 “Impromptu Query Definition” 选 项 ， 这 里 使 用 在 上 
市 中 你 存 好 的 .iqd 文件 作为 数据 源 。 单 击 “ 下 一 步 ” 按 钮 ， 选 择 数 据 源 路 径 ， 如 图 26-130 rm. 
单 击 “下 一 步 ” 按 钮 ， 完 成 数据 源 的 导入 ， 如 网 26-131 Dra. 


Please enter the following information about You have finished specifying the data source 
your data source. | « for your Transformer model. 


File name: 


: : Please specify if you want to run AÀutolesign 
[D: tenpXSales2VBI TARGET SALES. iqd d to create a preliminary model you can edit in 


the Dimension Map. Depending on the option 
Browse... | that you have chosen, AutoDesign may not be 
Isolation level: 


[Default "| 


取消 |«t—5o[r-ES mi |«t—bm[ sm] 
图 26-130 ”选择 数据 源 路 径 图 26-131 完成 数据 源 的 导入 
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选择 “Run AutoDesien” 复 选 栓 ， 然 后 单 击 “ 完 成 ”按钮 ，， Far 
这 时 弹出 “Transformer Error” 提 示 框 ， 如 图 26-132 所 示 。 i) Seene pp Ee em 

y 分 析 质 办， eM Ea 数 据 源 错误 误 | 需要 在 Definition (IQD) Runtime Gateway location, or from IOD file. 
COGNOS.ini 文件 中 添加 配置 来 完成 与 数据 源 的 连接 。 

Fæ gnos 的 安装 目录 ， 找 到 COGNOS.ini XE, XX 26-132 "Transformer Error" 
EHF, YEXCTEAK ERMA P XE: TENTE 


BI TARGET-^User ID:^?Password:;LOCAL;OR;ORACLE(2)es(qusa/?es() COLSEQ- 


HB, “BI TARGET” 是 数据 源 的 用 户 名 。 
然后 蛙 击 “完成 ”按钮 ， 将 会 弹出 提示 输入 用 户 名 和 密码 的 登录 对 话 框 ， 如 图 26-133 rn. 


Database Logon (BI TARGET) 











Enter a user ID and password that is valid for the database. 
User ID: 


[BI TARGET 


Password: 


Cancel | 





26-133 “数据 源 登 录 ” 对 话 框 


输入 数据 源 的 用 户 名 和 密码 后 ， 单 击 “Log On” 按 钮 ， 完 成 新 模型 的 创建 工作 ， 如 图 26-134 
所 示 。 








File Edit View Run Diagram Tools Security Window Help 

| DEHE A+ xX EgO K) EA ele 

lll Dimension Kap mA) X. Signons 
| à 





iip Data Sources "i [x] Neasures a 回 [x] £ PowerCubes a EIE * Custom Views 


"TT 


26-134 创建 的 新 模型 
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2. 多维 模 型 设计 


默认 的 设置 可 能 有 些 不 符合 多 维 模型 设计 需求 ， 这 时 需要 手工 进行 调整 。 首 先 设置 维度 ， 
如 图 26-135 所 示 。 








File Edit View Run Diagram Tools Security Window Help 


[DEAG o-4Txmm-3ommsusge 


从 Signons 


$BI_TARGET 





sert Dimension from Package... 
sert Dimension... 





|| sales 

-加 ID 

M 产品 名 称 
-B 产品 类 型 
[M 地 区 名 称 
: Zr 


[E 统计 日 其 





26-135 ”维度 调整 操作 


右 击 维度 窗口 中 的 态 ， 在 弹出 的 快捷 六 单 中 选择 “Delete Dimension” 命 令 ， 即 可 将 其 删 
除 ;“ 产 品类 型 ”也 用 同样 方法 删除 。 最 终 模型 效果 如 图 26-136 所 示 。 


L Transforaer — Hew Hodel 





Cex) 
File Edit View Run Diagram Tools Security Window Help 
DEHB o-4-xu:-ommEZusge 
lll Dimension Kap mE] A sSiznons 
— u 


lll Data Sources "PUES 


Neasures 





26-136 ”最终 模型 效果 图 


396 


用 同样 方法 进行 Measures 的 设置 。 
3. 创建 立方 体 


单 击 工具 栏 中 的 七 按钮 创建 立方 体 ，Transformer 将 会 自动 创建 一 个 立方 体 模 型 ， 
如 图 26-137 所 示 。 


Status 


Data Source: sales 


Source File: D: stemp*Salezz^Bl. TARBE... 1 af 1 


Step 2: Heading saurce data. 


Categories: 83 
Records: 1 





图 26-137 创建 立方 体 


创建 完成 后 ， 在 PowerCubes 窗口 中 将 会 显示 已 经 创建 好 的 立方 体 ， 如 图 26-138 所 示 。 


L Transforaer — Hew Hodel 





加 昌国 
File Edit View Run Diagram Tools Security Window Help 
| DEHE A+ xisol Kl Egz gle 
川 Dimension 下 ap ` Signons 
@ 统计 日 其 地 区 名 称 d)» TARGET 
azan 


闻 Data Sources f- lolx) = Custom Views 


Neasures id [m] b74 ** PowerCubes 加 回回 
lll] sales L 数量 f 
ID 
: 产品 名 称 
产品 类 型 
[M] 地 区 名 称 
[W 90 


[M] 统计 日 期 





Ready 
图 26-138 ”立方 体 模型 
4. 发 布 立 方 体 
右 击 “Sales” 和 选项， 在 弹出 的 快捷 菜单 中 选择 “Publish PowerCube as Data Source and 
Package” 命 令 进行 立方 体 的 友 布 ， 如 图 26-139 PTR. 
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- Iransformer [3 Hodel 


Ill Dinension Nap "UE ` Signons 


| G6 统计 日 期 | 产品 名 称 | 地 区 名 称 | BI TARGET 
[ve | reen | axem 


lll Data Sources "EE Neasures "HIE mm PowerCubes 加 回回 s Custom Views "HIE 
Properties 
Delete PowerCube 


Create Selected PowerCube 
Update Selected PowerCube... 


Fublish FowerCube as Data Source and Package... 
PowerCube Partition Status... 
Remove Übsolete Security Übjects 


PowerCube Status... 
Insert PowerCube... 











图 26-139 发布 立 方 体 
弹出 “Publish PowerCube” 对 话 杠 ， 如 图 26-140 所 示 。 


Publish PowertCube 


| 


PowercCube creation Enabled 

Status OK 

Date 2007-5-25 15:13:20 

Data Source Sales 

windows Location D Backup RA Transformer PowerCubesi Sales... 
Uni or Linux Location 

Last published date/time 

Published status Mat published 





图 26-140 “Publish PowerCube” 对 话 框 


选择 “Start publish wizard” 单 选 按钮 以 癌 导 方式 进行 一 个 立方 体 的 发 布 。 单 击 “OK” 按 
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钮 ， 如 图 26-141 所 示 。 


EM Publish PowerCube az Data Source and Package 




















图 26-141 ”发布 向 导 
在 进行 安全 验证 之 后 ， 将 跳 转 到 下 一 个 对 话 框 ， 如 图 26-142 所 示 。 


NE Publish PowerCube as Data Source and Package 
Welcome - New Data Source wizard Help 


The New Data Source wizard helps you create a data source and a first connection in the Cognos 8 server. It also gives you the option 
to test the connection and to create a first signon. 


You can dick back at any time to change your settings. 


Please click Next to start creating the data source. 





图 26-142 创建 数据 源 问 导 
单 击 “Next” 按 钮 ， 进 入 数据 源 设置 界面 ， 如 图 26-143 所 示 。 
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NM Publish PowerCube as Data Source and Package 


Specify a name and description - New Data Source wizard Help 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 


[Sales 


Description: 


Location: 
Directory > Cognos 


[Erne 











图 26-143 ”数据 源 设置 
在 图 26-144 中 输入 名 称 和 描述 等 信息 后 ， 单 击 “Next” 按 钮 ， 进 入 连接 串 设 置 界面 ， 
如 图 26-145 所 示 。 


NE Publish PowerCube as Data Source and Package 
Specify the Cognos PowerCube connection string - New Data Source wizard 
Edit the parameters to build a Cognos PowerCube connection string. 


Read cache size (MB): 


Re 


Location 
Specify the location of the cube on a Windows operating system. If the cube also resides on a Unix or Linux operating system, enter 
its location. 





Windows location: 


|D:\Backup\ 我 的 文档 \Transformer\PowerCubes\Sales.mdc 


Unix or Linux location: 


pomat ooo 


Signon 
Select an authentication method. 





(* All applicable namespaces (including unsecured PowerCubes) 
(^ Restrict PowerCube authentication to a single namespace 


Select whether a cube password is needed. 


厂 Cube password 
[V Create a signon that the Everyone group can use: 
Password: 


一 一 一 一 一 一 一 一 


Confirm password: 


一 一 一 





Testing 一 


Test the connection... 


| Cancel || <Back || Next> || Finish | 
图 26-144 ”连接 串 设置 
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fr “Read cache size(MB)” 文 本 框 中 输入 “10”， 然后 单 击 下 方 的 “Test the connection” 
按钮 进入 测试 连接 界面 ， 如 图 26-145 所 示 。 


| PoTerCube as Data Source and Fackage 


Test the connection - New Data Source wizard 
Test the parameters that make up the database connection. 
Connection string: 


^3Password:;LOCAL;PC; WIN, PATH-D:' Backup EET fs 
XTransformer 'PowerCubes'5ales.mdc; UNIX PATH-;readCacheSize = 10;cubePassvword 23/55 


Dispatcher: 
http: //liugf:3300/p2pd (Configuration) 


Test the connection using: 
Cube password: 





26-145 ”测试 连接 界面 
单 击 “Test” 按 钮 进行 测试 ， 这 时 Transformer 报 出 如 下 错误 ， 如 图 26-146 所 示 。 


EE Publish PowerCube az Data Source and Package 


View the results - Test the connection 


| = Name | Status | Message 
io du http://liugf:S300/p2pd Failed PCA-ERR-0006 The argument is invalid. 





26-146 测试 结果 


单 击 “Failed”， 弹 出 详细 错误 信息 提示 杠 ， 如 图 26-147 所 示 。 
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Windows Internet Explorer x] 


FCA-ERR-DOUE The argument is invalid. 

BSV-SRV-ÜU42 Trace back: 

R5ReportSerwice. cppÜT4T]: BgFException: CCL CAUGHT: RSReportSerwice::praceszí] 
RSReportServwiceMethod.cpp(21T]: UFException: CCL RETHROW: R5SReportSerwiceMethod::pracesztl: 
reportTestllataSourceConnection Request 

RSQueryMzr.cppilT8B6]: üFException: CCL RETHRÜW: RSüuersMzgr::testlataSource 
R5QuerwMzr.cppíl4T5]: gFException: CCL RETHBDW: RSQuerwMgr::executeRzapiCommand 
RSQueryMzr.cppíl482]: BgFException: CCL RETHRÜW: R5üuerwMgr::executeRsapiCommand 
R5QuerwMzr.cppíl43T]: BgFException: CCL RETHREOW: RSQuerwlMgr::executeRzapiCommand 
RSUFSezzion. cpp 186): QüFException: CCL RETHRÜW: RSUFSeszion::DoRequeszt 
HFSEezzion.cppíBO4]: QFException: CCL RETHRÜW: QFSSession::ProcessloRequest[(] 

QFSSession. cpp E02): FException: CCL CAUGHT: QFSSession: :ProcessloReguest I] 

QFSSession. cpp (1464): QFException: CCL RETHRÜW: NFSSession’: :SessionFrocessTestConmnectionl) 
DLAPPlannerHFSConnection. cpp 426): QFException: CCL RETHEOW: ÜPUFSConnection::FrowiderTeszt 
DULAPPlannerlFSConnection. cpp 25): QFException: CCL CAUGHT: DFAFSConnection: :FrowiderTest 
QFSSession. cpp E04): QFException: CCL RETHRÜW: QFSSessioni :Frocessloheguest [人 

QFSSession. cpp DZ): QFException: CCL CAUGHT: QF5Session::PraceszloRequest(]) 

QFSSession. cpp (1464): gFException: CCL RETHRÜW: QFSSession: :SessionProcessTestCormectiont) 
MPCAPPIS. cpp(182): QgFException: CCL THROW: MPCAConnection::GetCharSet 














图 26-147 错误 信息 提示 框 


分 析 错 误 原 因 , 造成 该 错误 的 原因 是 字符 集 不 匹配 , 应 进行 如 下 修改 , 如 图 26-148 所 示 。 


L Transforaer — New Hodel 








I Edit View Run Diagram Tools Security Window Help 








New... CtrltN 

Üpen... Ctrltü | 

Close "PE ` Signons "HUE 
: m | 8 BI TARGET 

Save CtrltS 

Save Ås... 


Session Information 


Currency Table... 


R i 
Rer £ 


Print Setup... 
Erint... Ctrl+P 


Preferences... F5 





Model Properties 





1 D:\temp\Sales3\Sales3. pyj 

2 D:\temp\Sales2\SALES2. pyj 

3 D: Backup ZR PASTr ansformer Models sec AHAN. pyj 

4 D: Backup; PáTransformerMModelssgolll.pyj | 回国 Pr et Ee 


EEX) :euston viers [- ax] 





Exit AltHF4 A» PR 











(M 统计 日 期 


图 26-148 ”模型 属性 设置 





打开 “Model Properties ”页面 属性 ， 修 改 “Cube code page” 值 为 “UTF-8” 即 可， 如 图 
26-149 所 示 。 
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Hodel 一 Sales 


Model name: 


[Sales 


General | Description | 


Default category ordering 
Ù Yes 
( Ho 


i+ Use the preference setting 


Cube code page: 





26-149 ”修改 “Cube code page” 1H 





模型 字符 集 设置 完成 之 后 将 原 立 方 体 删除 ， 重新 创建 并 发 布 立 方 体 ， 并 且 进 行 测 试 连接 ， 
此 时 将 显示 成 功 信 息 ， 如 图 26-150 所 示 。 


| Publish PowerCube as Data Source and Package 


View the results - Test the connection Help 


| .> Name | Status 


* 7 http://liugf:39300/p2pd Succeeded 





26-150 ”测试 结 


返回 到 如 图 26-151 所 示 的 对 话 框 ， 单 击 “Finish” 按 钮 ， 完 成 立方 体 的 发 布 。 


Signon 
Select an authentication method. 
(* All applicable namespaces (including unsecured PowerCubes) 


(^ Restrict PowerCube authentication to a single namespace 


m 
Select whether a cube password is needed. 


[^ Cube password 


J7 Create a signon that the Everyone group can use: 
Password: 


一 一 一 一 一 一 


Confirm password: 


Testing 


Test the connection... 





26-15] 连接 串 设置 
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完成 后 ， 系 统 提示 是否 进行 包 的 创建 工作 ， 如 图 26-152 所 示 。 


NE Publish PowerCube as Data Source and Package 


W The New Data Source wizard successfully created a data source and a first connection in the Cognos 8 server. 


[7 Create a package 





26-152. SEX n] Œ 
单 击 “OK” 按 钮 ， 进 入 新 建 数据 源 癌 导 ， 如 图 26-153 所 示 。 


NE Publish PowerCube as Data Source and Package | 
Specify the name and description - New Package wizard Help 
Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 


[sales 
Description: 


^ 


Select another location... Select My Folders 





图 26-153 ”新 建 数据 源 向 导 


Œ “Location” FÆ “Select My Folders", 然后 单 击 “Finish” 按 钮 ， 完 成 对 包 的 创建 
工作 ， 系 统 弹 出 如 图 26-154 所 示 的 提示 框 。 


Transformer Bessare 


ON. The data source with the name: '5 ales" 
d) and the package with the name: 'Sales' 


have been created. 





26-154 ”提示 框 


至 此 ， 使 用 Transformer 建立 多 维 模型 以 及 发 布 立 方 体 的 工作 全 部 完成 。 
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26.4.5 ”使 用 Analysis Studio 制作 多 维 报表 


登录 Cognos Connection 控制 侣 ， 选 择 “My Folders” 选 项 卡 ， 如 图 26-155 所 示 。 


Ny Folders - Cognos Connection - Windows Internet Explorer 
THO REO SEV KERM IAW 88h00 
Go- rn http: //1ocalhost:9300/p2pd/servlet/dispatch?b action-xts.run&a-portal/cc.xts&m tab-iB6TBBO3BEEel42Ci | |*+|| X | 百度 let] 
-B-&e-pxio-QrAo-" 


d 
E -7 
Public Folders My Folders | 




























L i L1 e My Folders - Cognos Connection 












































My Folders [e| 31 iC Bf € ES | x S xir 
Entries: |1 -|2 © | [me 
口 | |MName$ | Modified & 
D Gp 产品 销售 区 域 May 25, 2007 3:30:47 PM EST More... 
OD üp 产品 销售 区 域 2 May 25, 2007 2:46:11PM EST More... 
完成 Internet 1008 * . 


26-155 Cognos Connection 控制 台 界 面 


单 击 “ 产 品 销售 区 域 2”， 然 后 选择 右上 角 的 “Launch” 一 “Analysis Studio ”命令 ， 如 
图 26-156 所 示 。 





Ny Folders 一 Cognos Connection 一 Windows Internet Explorer 


文件 区) AHE SAV RERA IAT 帮助 出) 











o 

















Go ~ [E] http: //1ocalhost:9300/p2pd/servlet/dispatch?b action-xts. run&n-portel/cc.xtsán folder-iAl040920CADR4 V ||*4+]| x| | 百度 IF 
i 
^ » 
3 d En Folders - Cognos Connection | em 区 M dh i IET z O IAM z 
k i 

E CORET 


hN Query Studio 
- © Analysis Studio 
My Folders > 产品 销售 区 域 2 Tic BÉ Gh Report studo 
@ Event Studio 
A Drill-through Definitions 













Cognos Connection 








Public Folders My Folders 











Entries: 





O| |Wamee | Modified $ 


yi Cognos Administration 





Internet &100$ ~ :: 


dil 
如 


-二 EL oS 


26-156 “Analysis Studio” X 
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此 时 将 会 打开 Analysis Studio 工具 ， 如 图 26-157 所 示 。 


一 Windows Internet Explorer 


THO 编辑 下) SEVU REXA IAT) ABH) 








AA. EL | TNT PH 
e» € rn http://localhost:9300/p2pd/explore/explore.htm hc | | * | X | | 百度 | p | 


3 d ep Ew Folders - Cognos Co... e x — 从 ~ dh ~ IX x BIRM E! | 


File Edit View Settings Run Help 


DGkbBHigxoweao!ir-R-yYzxiü3--z-HB- 


















t~ 加- £5 





Blank Analysis 


[V] Show this dialog in the future 








26-157 Analysis Studio 界面 


选择 “Default Analysis", a “OK” jZHl, Analysis Studio 将 会 目 动 创建 报表 结构 ， 
如 图 26-158 所 示 。 


New 一 ånalysis Studio 一 Windows Internet Explorer l- efx) 





文件 多) BG) SEV KEKA IAT ARA) 


GA v E http://localhost: 9300/p2pd/explore/ explore. htm v D [x] BE 


w od se|- Em Folders - Cognos Co... PT - Analysis Studio x| 从 -odh c HHNBO-UOIBRO- | 











File Edit View Settings Run Help 
D GEI xoeawaa|r-E-|Y-E-i?-|E2 M) M) 


DT T PEEEEEN urs crime 
E « (mam | {rae l^ 

















i| Sales2 

«e Cast ARA 

日 - 旦 产品 名 称 
四 欧式 家 具 


[2009 | 
cm 地 中 海 家 具 2000 | 1146 462 | 558 | 652| 88 | 1080| 261 450 4697 
mus 








umi RH 
um 现代 家 有 具 | | 
四 实木 家 具 统计 日 1146 488 558 2379 442 1532 377 632 2643 10197 
Bn 红木 家 有 具 l 
m 中 式 家 具 
Bm 时尚 家 具 
um 田园 家 具 
日 - 旦 地 区 名 称 
= 朝阳 
um 
um 
um EE 
um 延庆 
um 东城 
& E] Measures 
有 ,数量 


S G 


Internet 





26-158 ”自动 报表 生成 
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KEE WKAR” TECTA AA RS, WE 26-159 所 示 。 


New * — Ànalysis Studio - Windows Internet Explorer 












File Edit View Settings Run Help 
DBHgxeada|r-RB-Y- E B it E l i- (3 
DTTTREEEEEE ES (072— z 

€ f| Gm. | frs - (usen 
&- C3sstit ARA 
9-9. 产 品名 称 









































^ 




















5 欧式 家 有 具 
一 Bm 地中海 家 具 
m HARA 
m 现代 家 有 具 
一 Bm 实木 家 具 
m 红木 家 具 
一 Bm 中 式 家 具 
一 Bm 时尚 家 具 
um 田园 家 具 




















um 朝阳 

-平谷 
um Ao 
-m 昌平 
一 Bm 延庆 
一 zit 
一 天海 演 
日 -图 Measures 
-AE 














3 ol 


"o < 重 = M Far Left € Paae Left f Page Right 


Information - 地 区 名 称 












图 26-159 ”多 表 头 设置 
然后 右 击 “地 区 名 称 ” 将 其 隐藏 显示 ， 如 图 26-160 所 示 。 


New +*+ — ånalysis Studio -— Findows Internet Explorer 





文件 ED 编辑 人 E) SEV KERA IAM  *ER5QD ] 


GO- E] httpi//lecalhost:9300/p2pd/explore/explore.htm —————000000000000 M http: //localhost:9300/p2pd/explore/explore.htm v | 好 || x| Pa 
和 Ern | 


File Edit View Settings Run Help 


D GB! xomwq!|r-FK-Y-E-di20t-|02 Z- EB- | 5- 加 | 加 网 


















































































































| wem qe TS 
mg —— o (summ | £r&&m furam | ^ 
& Catit AR | 
e rud 
um 欧式 家 具 
一 地 中 海 家 具 
国松 术 家 具 | | | | Hide 
gm 现代 家 具 | " 
um 实木 家 具 | P| = 
gm 红木 家 具 T | | 131 到 Exdude 
 mmDXXA 7 
权时 尚 家 具 S$ Sort 
um 田园 家 具 Calculate 
exams 
= 朝阳 Suppress Rows 
um 
mM Drill Down 
um 昌平 am Dr Up 
um 东城 
cm UE Show Attributes 
& [Measures DU nre 
Lon Properties (地 区 名 称 ) 
| S8 | © =i- M Far Left 4 Page Left P Page Right 








Information -地 区 名 称 LEE 


26-160 ”隐藏 操作 
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最 终 效 果 如 图 26-161 所 示 。 


New * 一 Ànalysis Studio 一 Windows Internet Explorer 





TFE mE 查看 名” WEG) IAW 帮助 出) 
e» a le http: //localhost:9300/p2pd/explore/explore. htm vl x| | 百度 | p z 














3» d 8g f My Folders - Cognos [ES [Ber * - analysis Sto 3 t id z dh 区 [sr Xm -BIRM hd il 





File Edit View Settings Run Help 

DGEBIGxomaSir-FE-|Y-zx-d2- E e)l M) 

s Grec 
«| fSUrBH > | 和 £ BN if ~ | 


[gsales2 
由 -加 统计 日 期 
Bs 产品 名 称 
a 欧式 家 具 
地中海 家 具 
m 松木 家具 
m 现代 家 有 具 
um 实木 家 具 
m 红木 家 有 具 
m 中 式 家 具 
5 时 尚 家 具 
um 田园 家 具 
日 时 地 区 名 称 
um 朝阳 
um 
um 
ume 
um 延庆 
um 东城 
um 海 证 
&- 5| Measures 
LL, 数量 









































E © M Far Left 


ft « Pace Left » Page Right 


LE I MEN E 





图 26-161 最终 效果 图 


26.4.4 ”查看 报表 


单 击 “ 运 行 ”按钮 -， 在 弹出 的 下 拉 列 表 中 选择 了 》&rseettmy 选项， 显示 的 
AUR UIS 26-162 所 示 。 





Cognos Yiewer 一 Windows Internet Explorer 


文件 下) ”编辑 多) EEV KEKA IAU Rw) 





oo m E http: //localhost:9300/p2pd/servlet/dispatch vd | [s [xj 百度 
| 


D- &-ixsp-QrAo-" 






































26-162 ”运行 报表 
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26.9 ”本 章 小 结 


1) Cognos 的 安装 分 为 : 服务 器 安装、Framework %2., Transformer 安装 、PowerPlay 安 
JE Age 
TR SE o 

2) Cognos iE BU mi WITIKKA: 将 程序 部 署 到 Cognos 目 市 的 Tomcat 服务 器 并 
发 布 。 

3) Cognos 局 动 的 方式 有 两 种 。 一 是 在 Cognos Configuration 中 ， 单 击 工 其 栏 中 的 ^ 按钮 
启动 ， 二 是 在 Windows 服务 中 ， 选 择 Comos 8 选项 局 动 。 

4) 本 章 还 介绍 了 使 用 Framework 建 模 与 Transformer 立方 体 多 维 建 模 的 步 又 。 
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第 27 i 


本 章 目标 


Cognos 实例 


前 面 儿 章 ， 学 习 了 Cognos 的 工具 介绍 、Cognos 的 安装 与 快速 使 用 ， 接 下 来 本 章 将 介绍 


儿 种 着 用 的 报表 类 型 开发 。 
学 习 本 章 后 ， 您 将 掌握 : 
€ Section 报表 的 开发。 
€ Conditional Style 报表 的 开发 。 
€ Chart REIF Z. 
€ Drill-Through 报表 的 开发 。 


214 Section 报表 的 开发 




















Section 报表 可 以 将 分 组 的 子 段 以 分 块 的 形式 展示 给 用 户 ， 展 示 消 晰 、 不 易 千 成 混乱 。 
Section 报表 的 应 用 很 多 ， 比 如 工资 条 束 是 以 这 种 方式 统计 并 打印 出 来 的 。 接 下 来 为 大 家 展示 


一 个 简单 实用 的 Section 报表 开发 实例 。 


首先 使 用 Framework 制作 模型 实例 ， 制 作 好 的 模型 如 图 27-1 所 示 。 


2 Sales2 一 Framework Manager 
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Model Comments 
Screen Tip 
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| f 中 中 了 3 加 | Definition «Click to edit. 
Is Bole Based false wi [ Show ObjectId 





完成 


图 27-1 


410 





模型 图 


然后 打开 Cognos Connection， 选 择 发 布 好 的 包 “ 产 品 销 售 区 域 2”， 选 择 “Query 
Studio” 命 令 进入 到 报表 页 面 ， 如 图 27-2 所 示 。 


Ey Folders 一 Cognos Connection 一 Windows Internet Explorer 加 回国 
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图 27-2. 控制 合 界面 
进入 Query Studio 报表 开发 工具 后 ， 在 “Insert Data" KA F, Xem *SgW HH” 
“产品 名 称 ” “地 区 名 称 ” 和 “数量 ”依次 选中 ， 并 单 击 下 方 的 “Insert 信 ”按钮 插入 到 右 侧 
的 工作 区 中 ， 如 图 27-3 所 示 。 
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27-3 Query Studio 报表 制作 


选择 “数量 ” 列 中 的 数据 ， 然 后 单 击 “Text Alignment" jZ HIE, ， 选 择 “Align Top 
Center” 选 项， 将 其 设 为 大 中 显示 。 

接 看 调整 日 期 格式 ， 选 中 “统计 日 期 ” 列 中 的 数据 ， 选 择 “Edit Data" X% FHI 
“Format Data” 命 令 ， 随 后 弹出 “Format data” 域 ， 如 图 27-4 所 示 。 
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Format data 


Specify how you want the data to appear. Choose Default format to revert to the original format. 


Category: 


Default v 





| ok || cance | 





在 “Category” 下 拉 列 表 中 选择 “Date” 选 项 ， 


08/2003” 选 项 ， 如 网 27-5 所 示 。 


Specify how you want the data to appear. Choose Default format to revert to the original format. 


Category: 











ok || Cancel 





27-4 Format data 域 


27-5 


在 右 侧 出 现 的 “Type” 下 拉 列 表 中 选择 “19/ 


Type: 









19 Aug 2003 
19 August 2003 
Tuesday, 19 August 2003 








日 期 格式 化 


单 击 “OK” 按 钮 ， 完 成 日 期 格式 化 ， 如 图 27-6 所 示 。 
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全 者 进行 分 段 设置 ， 选 中 “产品 名 称 ， 


“Create Sections” 
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图 27-6 格式 化 后 的 日 期 


列 名 ， 然 后 选择 “Change Layout" 35 FH 
，Query Studio 将 目 动 进行 分 段 ， 效 果 如 图 27-7 PZR o 
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图 27-7 Section 报表 
人 至此， 完成 了 一 个 完整 的 Section 报表 的 制作 。 


21.2 Conditional Style 报表 的 开发 


在 Conditional Style 报表 中 ， 符 合 条 件 的 数据 可 以 突出 显示 。 例 如 ， 当 前 某 产 品 的 销售 
AKT 10 万 元 人 民 币 ， 则 突出 显示 ， 背 景色 为 红色 ， 学 体 为 绿色 、 加 粗 。 

本 节 将 演示 一 个 Conditional Style 报表 的 开发 过 程 。 

首先 使 用 Framework 制作 模型 实例 ， 制 作 好 的 模型 如 图 27-8 所 示 。 


2 Sales2 一 Framework Nanager 
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Screen Tip = 
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Languages = 
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Is Eole Based false wif Show Object Id 


= C 
图 27-8 ”模型 图 
然后 打开 “Cognos Connection ”， 选 择 友 布 好 的 包 ， 在 选择 “Report Studio” 进 入 到 报表 
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页 面 ， 如 图 27-9 所 示 。 
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图 27-9 控制 台 界 面 


进入 到 Report Studio 报表 开发 页 面 后 ， 依 次 将 查询 项 “统计 日 期 ”产品 名 称 ”“ 地 区 名 
称 ” 和 “数量 ” 拖 入 到 右 侧 的 工作 区 中 ， 如 图 27-10 所 示 。 


New* — Report Studio — Windows Internet Explorer 
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27-10 报表 设计 
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单 击 工作 区 的 空白 处 ， 然 后 单 击 快速 工具 栏 中 的 “居中 显示 ”按钮 ， 将 列表 居中 显示 ， 
如 图 27-11 所 示 。 
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File Edit View Structure Table Data Run Tools Help 
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27-1 居中 设置 


单 击 “ 数 量 ” 列 下 方 的 “< 数量 >” 项 ， 此 时 工作 区 样 
式 如 图 27-12 所 示 。 

接着 单 击 “Conditional Style” 按 钮 国 ， 随 后 弹出 “Condi 
tional Styles 条件 样式 )” 对 话 框 ， 如 图 27-13 所 示 。 27-12 ”选择 “数量 ”后 的 效果 图 




















| F | | 
y Conditional Styles 


B-S5xtT11 





























27-13 "Conditional Styles ”对话 框 


单 击 “新 增 ” 按 钮 除 -， 在 弹出 的 采 和 单 中 选择 “New Conditional Style” 命 令 狐 建 一 个 样 
式 ， 如 图 27-14 所 示 。 
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New* — Report Studio 一 Windows Internet Explorer 
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File Edit View Structure Table Data Run Tools Help | 
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成 Internet 108 * .: 
27-14 “新建 样式 
选择 “数量 ”选项 ， 然 后 单 击 “OK ”按钮 ， 弹 出 “Conditional Style-Numeric Range" XJ 
话 框 ， 如 图 27-15 所 示 。 


New* — Report Studio 一 Windows Internet Explorer 
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27-15 "Conditional Style-Numeric Range” 对 话 框 
单 击 图 27-15 中 的 “新 增 ” 按 钮 也 ， 设 置 一 个 范围 值 ， 比 如 “500” 如 图 27-16 所 示 。 
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New* 一 Report Studio 一 Windows Internet Explorer 
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File Edit View Structure Table Data Run Tools Help 
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27-16 设置 范围 值 
然后 单 击 “OK” 按 钮 ， 此 时 “Conditional Style-Numeric Range” 对 话 框 变更， 如 图 27-17 
所 示 。 





NWew* — Report Studio - Findows Internet Explorer 
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27-17 “Conditional Style-Numeric Range” 对 话 框 发 生变 化 
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设置 目标 是 : 如 果 “ 数 量 ” 大 于 500 人 ， 则 样式 更 改 为 背景 色 是 黄色 、 字 体 颜色 是 红 
色 、 加 粗 字 体 。 单 击 图 27-17 中 最 上 方 的 “编辑 ”按钮 ， 弹 出 “Style《〈 样 式 )” 对 话 框 ， 
如 图 27-18 所 示 。 
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27-18 “Style” 对 话 框 


设置 完成 之 后 ， 范 围 设置 对 话 框 显示 如 图 27-19 所 示 。 
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27-19. 新建 样 式 
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此 时 “Conditional Styles ”对 话 框 中 显示 为 一 个 条 件 ， 如 图 27-20 所 示 。 


y Conditional Styles Help X | 


Conditional Style 1 














KO i | Cancel | 
图 27-20 “Conditional Styles” 对 话 框 


单 击 “OK ”按钮 完成 条 件 样式 的 设置 。 运 行 报表 ， 凡 是 “数量 ”大 于 500 AWEKA 
景色 显示 为 黄色 、 邓 体 颜 色 为 红色 、 并 且 加 粗 显 示 字 体 ， 如 图 27-21 Br. 





























Dec 31, 2010 12:00:00 AM SARA | 朝阳 

May 20,2009 12:00:00 AM MERA ^F 182 
Dec 20,2010 12:00:00 AM 地中海 家 有 具 | 朝阳 462 
Oct 1, 2010 12:00:00 AM RERA 朝阳 88 
May 1,201112:00:004M KARA 8g 354 
May 10,2011 12:00:00AM SERA Fih 452 
Sep 15,2010 12:00:00 AM PERA 延庆 261 
Mar 20, 2009 12:00:00 AM PARA RE 116 
May 13,2010 12:00:00 AM | 欧式 家 具 | 朝阳 780 
May 20, 2010 12:00:00 AM HERA 大兴 263 
Aug 31, 2009 12:00:00 AM MERA AA 485 
Jani,201112:00:00 AM MARA 朝阳 

Jan3i,2010 12:00:00 AM MTERA | iE 450 
Mov 22,2010 12:00:00 AM 欧式 家 有 具 | sin 366 
Octi,2010 12:00:00 AM HERA | 朝阳 285 
Mov 18,2009 12:00:00 AM 地 中 海 家 具 F 

Sep 30,2009 12:00:00 AM MAZA — | 朝阳 

Oct 16, 2010 12:00:00 AM | 现代 家具 | 昌平 
Jul21,201112:00:00AM MAZA | ski 

Apr 1 2009 12:00:00 AM MERA | MAE 286 


图 27-21 报表 效果 图 
人 至此， 完成 了 一 个 Conditional Style 报表 的 制作 。 


21.3 图 表 型 报表 的 开发 


图 表 型 报表 ， 以 其 表达 明确 、 方 便 查 看 、 对 比 清晰 等 特点 被 很 多 的 决策 管理 者 在 工作 中 
使 用 ， 因 此 ， 本 市 将 对 如 何 创建 图 表 型 报表 做 一 个 人 简单 的 演示 。 
首先 ， 使 用 Framework 创建 一 个 模型 ， 如 图 27-22 所 示 。 
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> Sales2 #4 一 Framework Nanager 加 回国 
File Edit View Diagram Project Repository Actions Tools Help 


EXT IP CuRedo | $ Ba EX | E met 
| Back DForward | T F ||salesz rpramro— [R| & 10s - S J£ 24 | C5 E ib à 


E Explorer qe Diagram |[[[] Dimension Map | 












Project Viewer 


D, Sales2 Summary Ez Search &g Dependencies | 
c- RE BI TAECET : — - 
: zw SERE Select an object to view its dependencies 
Ee. ID 
be 四 产品 名称 m m | 
T 产品 类 型 edd 
i I'll 地 区 名称 Viewer here to view its dependencies. 
i. 产量 
Le pn 统计 日 期 


B. ® Data Sources 
由 - Parameter Maps 
B. (ii) Paen 






Dependent objects 





Enopentiles No Dependencies Found. 


Properties | Language | 
Hame AMAER 
Description | 
Last Changed ,2007-05-25T14:46:11 
Last Changed Br Anonymous 
Model Comments 
Screen Tip | 
Last Published ,2007-05725T14:46:11 
Last Publish Location [Directory > Cognos > Anonymous > My ... 
Mar Versions 0 
Languages [«Click to edit.» 
Definition |«Click to edit.» 


" Is Bole Based [false {|| [ Show Object Id 
zz NN 














27-22 ”模型 图 
接 下 来 ， 打 开 Report Studio 工具 ， 新 建 报表 类 型 时 选择 “Chart” 报 表 ， 如 图 27-23 所 示 。 


Package: 
AMEE? | 


| 


Blank List Crosstab Chart Map Financial 


是 一 jh -A 
S i] © 


Repeater Table Report Template Existing... 





图 27-23 报表 类 型 图 
单 击 “OK ”按钮 ， 在 图 表 类 型 中 选择 “Column” 和 选项， 如 疼 27-24 Br. 
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IT Insert Chart Help 


|Z" scatter, Bubble, Point 
G Radar, Polar 


e Gauge 
| The data series appear as separate groups of colored columns. The top of each 
mm Metrics Range column represents the value of the data series. This chart compares actual 
values. 





27-24 图 表 类 型 图 
单 击 “OK ”按钮 ， 开 始 创建 图 表 型 报表 。 此 时 的 Report Studio 显示 如 图 27-25 所 示 。 























Wew+ — Report Studio -— Findows Internet Explorer 
WFE mE EAV KEXA 工具 民 ) 帮助 加) 
一 一 一 - 
SAZ v 回 http://localhost:9300/p2pd/pat/rsapp. htm v | eq X | | BE |o M 
: - f : » 
3 d GME My Folders - Cognos Co... e Hew* - Report Studio X e Cognos Viewer | | ai V M dh m c mm (p- G 工具 (Q) ~ 








File Edit View Structure Table Data Run Tools Help | 
D GEHixsmmxieoitimp-[Rb-ie- ti8 ti Y H- a B-iE 8 8B (2 (B-Lü 585 0 1? 


Fe LIF EiA-i»zui EEH S-i —- [x 上] 田 -i 肯 - S xisE-5E-C xiv v 


LU 
illi 
iil 
WI 














gp | Pase layers: | Context filter: 
F 7% Drop members here to create page layers | ^V Drop members here to create a context fiter (sicer) 
o mg 产品 销售 区 域 2 3 | 
昌国 SALES M ble click edi 
. Fi Double click to edit text 

e "p 统计 日 期 号 

e "p 产品 名 称 

sp 

日 -图 xa 

L, 数量 





abc — abc 
由 Zoos titles: 





Category (x-axis): 


stu ^ Dp ien her 




















dil 
E 
ti 
E 
; 
5 
A 
g 











27-25 Report Studio 界面 


具体 步骤 如 下 : 
1) 将 “Measure” 下 的 “数量 ” 拖 入 到 工作 区 的 “Default measure (y-axis)” 中 ， 如 图 27-26 
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Bras. 


New* 一 Report Studio 一 Windows Internet Explorer 





XE) 编辑 个) SEO REKA IAT) 帮助 0 























/~ 
Yr http: /flocalhost:9300/p2 h Mtf X| | 百度 
red e ttp: //localhost /p2pd/pat/rsapp. htm | || | | lef) 
* ii m Br Folders - Cognos Co.. Je New* - Report Studio X le Cognos Viewer em- (A dh ~ IE - QIRO x 
File Edit View Structure Table Data Run Tools Help | 
DSH pAn) Mt- es tiB Ti Y H-M-z- Bei d S m m- ai i? 

[Font Bj TA e rres EEE &-i2:—[« z]g-ig- E E -ixiv v 
T Conima faer | 
E 7%  Dropmembers here to create page layers ^  Dropmembers here to create a context fiter (sicer) 

日 gr Ratis e 








Œ- jig SALES 

m "p 统计 日 期 
P 产品 名 称 
由 -他 地 区 名 称 


4e40|dx3 a6ed 四 





abc abc abc 
E Axis titles: 


' Category (x-axis): 


saa Am ë 





A 


Internet 100% ~ 


27-26 9A E 


2) 将 “地 区 名 称 ” 拖 入 到 右 侧 工作 区 的 “Series” 中 ， 如 图 27-27 所 示 。 
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New* — Report Studio — Windows Internet Explorer 


Xt) 编辑 区) SAU KEKA IAT) H) 


SAZ) M le) http: //localhost:9300/p2pd/pat/rsapp. htm v | (*+] [x] BE 
3 d egi Em Folders - Cognos Co... [e - Report Studio X [Bm vis————— a zi M = Vv [y xU - GIRO TE 


File Edit View Structure Table Data Run Tools Help | 






































D Gi£gmxiooid;B)b-[SaB-ie-1:8 PY 2% M- z- BieiH) d Bde mia m i? 
Font be ziA-i»z el rm Je- B € mise-eseixiv-wu 
Jea Contea fter | 
u |7% Drop members here to create page layers 7% Drop members here to create a context filter (sicer) 
c Rig 产品 销售 区 域 2 f= 
Œ- agi SALES a 
oP 统计 日 期 il 





m ^p 产品 名 称 
oP 地 区 名 称 
a,i, 地 区 名 称 
由- Members 


| Defauit measure eo 


EE HEKER 


+ 
Ma —^ Drop item here | ， 


由 -四 地 区 名 称 (AIl) 
日- 图 数量 
la AE 





(Default Legend Title) ， 





Internet R 100% 7 


dil 
E: 


27-297 网 表 设置 


3) 将 “产品 名 称 ” 拖 入 到 右 侧 工 作 区 的 “Category (x-axis)" P, nl 27-28 所 示 。 


New* — Report Studio — Windows Internet Explorer mex] 





wi Hedik mHE SEVU RERA IA  $EB»O0 

GO J v | http://localhost:9300/p2pd/pat/rsapp. htm v [e| x| BE ll- 
* il [g 8- Ew Folders - Cognos Co... B nee - Report Studio X [gi crees Viewer | | ta vi dah X is Ou - FIAM - 
File Edit View Structure Table Data Run Tools Help | 

D BGEHix&iexioeoimp-[alb-ie-ti8t-iY 4-s-z-BeinOBGOB- LET ? 
En EDS ZEE 
JG 

o B r- Sat ht <^ 


a m SALES Double click to edit text 
由 -名 统计 日 期 
à » 产品 名 称 生生 生生 生生 和 生生 让 主攻 生生 生生 生生 RCR 
"v rem 
H-O Members 
ge 产 品 各 称 (aD 






































» 















nbu 
» 


7-7 B 
age layers: Context filter 
7% Drop members here to create a context filter (sicer) 

















Drop members here to create page layers 


























日 jd TET BEE RS T BERRIS 
n AEAF : | : 
出 C3 Members 
由 -加 地 区 名 称 (All) 
由 -四 地 区 名 称 
日 -图 数量 


s T u 


[4] 
© Conditional a 
Conditional Styles 
Style Variable 







> abc abc abc abt 
HAs piles: 

Category (x-axis- 
CICeETTEDESPES 












































完成 (Oi | |  |@ Internet | R100% ~; 
图 27-28 TUE 


4) 单 击 “Axis titles” WAH “H SKEEF, WBK 27-29 所 示 。 
5) 双击 模 看 的 “abc” 图 标 后 的 字体 ， 输 入 “产品 名 称 ” 如 图 27-30 所 示 。 


产品 名 称 


lli! Double click to edit text 





图 27-29 ”标题 设置 图 27-30 输入 框 


6) 双击 竖 痢 的 “abc” 图 标 后 的 字体 ， 输 入 “数量 〈 单 位 : E). KAW Axis titles 如 
E| 27-31 所 示 。 

7) 在 “Insertable Objects” 窗 口中 单 击 “ToolBox” 选 项 卡 ， 将 “Query Calculation” 组 
件 拖 入 到 右 侧 工作 区 的 “Axis titles ”下 设置 好 的 “数量 (单位 : 套 )” 后 面 ， 在 弹出 的 
“Create Calculation” 提 示 框 中 输入 “Name” 值 为 “total”， 如 图 27-32 所 示 。 


E Axis titles: Create Calculation 
E Fus 
Ha mm (ee E) 


27-31 标题 27-32 "AX "Name" fü 
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8) 单 击 “OK ”按钮 ， 在 随后 弹出 的 “Data Item Expression" XJ i5 flf] “ Expression 
Definition” 文 本 框 中 输入 “total([ 数 量 )” 然后 单 击 上 方 的 “验证 ”按钮 进行 表达 式 验 证 ， 
无 误 后 显示 如 图 27-33 所 示 。 


New* — Report Studio 一 Windows Internet Explorer 加 回国 





文件 | wig) SEU KERA IAM  $B500 


GO v |É|http://localhost:9300/p2pd/pat/rsapp. htm Jisai X BE |o -| 

» 
3r d lg g|- -Je Public Folders - Cogno.. [nen - Report Studio X T | a- B - dh ~ p ABO - UO IR (Q) ~ 
File Edit View Structure Table Data Run Tools Help | 


DGEHismexi ln ex e p Bme» t! 中卫 -1 了 欠 - 对 E- z-H-ineB8mE ww ? 


- A cx pm 
= ET Item 到 [TG Help xl aki ce ad 


Ta A ailable ts: : BEI 1 
ia ene S [ll : ER S m MIX a context filter (sicer) | 
Text Item : THAT 
& Ig sales2 Expression Definition: 
£i Block & "p 统计 日 其 total ([Z8& ]) 
EH Table oP 产品 名 称 
[ab] Field Set e ^p 地 区 名 称 
EB Calculated Member & E Measures 
RA Calculated Measure L BEI 











































CJ Crosstab Space en us 


Œ] Crosstab Space (with fact c 


[ESI 


© Conditional 
Conditional Styles E | x | ETT] ls: Tips | Errors 
Style Variable 
Text Source Variable | F 












































完成 | | | | | | ed nternet &100$ 7 ,; 
图 27-33 计算 式 设置 
9) Hii "OK" eus 最 后 设计 好 的 图 表 型 报表 样式 如 图 27-34 所 示 。 





27-34 THK 





100 保存 后 单 击 “ 运 行 ” 按 钮 ， 最 终 效 末 如 图 27-35 HR. 
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2,000 


1,600 


1,200 


800 


数量 (单位 : = ) 10,197 


400 


0 
红木 家 具 MERA ”时 尚 家 具 ”松木 家 具 ”中 式 家 具 MARA 地 中 淘 家 有 具 实木 家 具 MERA 


产品 名 称 


图 27-35 ”运行 报表 


到 此 为 止 ， 完 成 了 一 个 完整 的 图 表 型 报表 的 开发 实例 。 





21.4 Drill-Through 报表 的 开发 


使 用 Drill-Through 访问 ， 可 以 在 一 个 会 话 范围 内 从 一 个 报表 跳 转 到 另 一 个 报表 。 比 如 ， 


可 以 从 一 个 产品 的 销售 报表 跳 转 到 该 产品 的 风险 报表 ， 也 
到 某 成 本 的 明细 报表 。 





可 以 从 一 个 企业 成 本 统计 报表 跳 转 











与 单一 报表 相 比 ，Drill-Through 可 以 帮助 用 户 整合 业务 
一 起 ， 最 大 程度 地 多 方位 了 解 企业 业务 。 

1. 使 用 Framework 创建 数据 模型 

使 用 Framework 制作 模型 在 这 里 束 不 做 过 多 的 介 





应 用 ， 将 多 个 报表 崇 密 地 联系 在 


， 制 作 好 的 模型 如 图 27-36 所 示 。 





z: Sales2 — Framework anager 

































































| File Edit View Diagram Project Repository Actions Tools Help 
| D| E H| udi Mka | $ Ba AX - (E Y | 
| Pack 加 Forward | $ C162 > BI_TARGET [x ja | (& 10 > B. E 此 af c e mi aa | 
'roject Viewer iz Explorer ge Diagram 让 四 Dim n Map Tools 口 x| 
El ia Sales Bs Summary y «s Search 总 Dependencies | 
=E] BI_TARGET 
| Select an sid to view its dependencies 
rag & drop an object from the Projec 
! ere t "ew its dependent 
| Dependent objects 
Propert Hx 
Propert Lang 
Ham AREE Tro ^l 
Description 
Last Changed 2007-05-25T115:44:03 
Last Changed Br Anonymous 
Model Co! nts 
Screen Tip 
Last Published 2007-05-25T15:44:03 
Last Publish Location i > Cognos > Anonymous > My ... 
Max Ve ons 0 
Langua «Click to edit.» Ll 
I p o d DF Definition «Click to edit. > 
o Is Role Based | false Mif Show Object ld EER 
zs C Wa 








图 27-36 ”模型 图 
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2. Cognos Connection 打开 发 布 的 包 《〈 见 图 27-37) 
3. 使 用 Report Studio 创建 详细 列表 信息 页 
首先 创建 一 个 List 报表 ， 如 图 27-38 所 示 。 





ers — Cognos Connection -— Findows Internet Explorer 


E) http://localhost:9300/p2pd/servlet/dispatch?b action-xts.rur Y | | | X | [百度 I 四 | Package: 


x [sae wc | B Mininistra... | | a hs 时 E h hi [y nme) d UO IA "d 5 | [产品 销售 区 域 2 


(ty | Public Folders l My Folders | 


public Folders [5] 3:)cf Bf € ER [X m f x 0m P8 
Entries: -[2 ©| | I (m 
| Modified & | Actions 


























O @ saes May 25, 2007 3:28:46 PM More... | | Repeater Table Report En Existing... 


O Gg 5ales2 May 25, 2007 3:50:30 PM More... 








图 27-37 控制 台 图 27-38 ”报表 类 型 


将 Insertable Objects 中 “产品 销售 区 域 2” 查 询 主 题 下 的 “统计 日 期 * “产品 名 称 ” “地 
区 名 称 ” 和 “数量 ”依次 拖 入 右 侧 工作 区 中 ， 如 图 27-39 所 示 。 


[上 
文件 他) 编辑 让) 查看 他 KEXA IA  $B5OD 
Ap -一 
e» € Y n http: //localhost:9300/p2pd/pat/rsapp. htm vi x | | BE E -| 


k k gf f My Folders - Cognos Co... [ees - Report Studio x| m- ”所 ~ EP ABO - Z Iaw x | 


File Edit View Structure Table Data Run Tools Help | 
D GHixS5Sexiooidmp-[8b-ie- tis «iv csl rr HR: 
[Font -区 -]i&-ipzvim iEEBHi&-iz—-[x :B-iB-m xim GREBSHxiv-vwB 


c Bs] r7 ine ES eo 
c Wl SALES 

ID 
国 | 产品 名称 
a | 产品 类 型 
ar 地 区 名 称 
TEE 
车 统计 日 期 

















JaJoldx3 AAND 





Internet 





图 27-39 设置 报表 
接 下 来 ， 打开“Query Explorer” 视 图 ， 双 击 “Query1” 如 图 27-40 Pr. 
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New* — Report Studio — Windows Internet Explorer 


THO 编辑 于) SEV Uu Go) IA $8500 











SA2 v E) http://localhost:9300/p2pd/pat/rsapp. htm v*r x] | 百度 22 











Q- D- &-DxSo-QrAao-" 


99 |+ Em Folders - Cognos Co... [e - Report Studio X | 





File Edit View Structure Table Data Run Tools Help | 
DGkHixsme&xieoidlmb-[ab-i€e-t1i837iv i5 夺 - 三 - Beim eame Imi? 
Font Eee LliA-in z vi iB BEI S-id4- — bs HE -m S mit&- £-ixiv- v 





o Ri 产品 销售 区 域 2 

c Wü SALES 
[E 
a rud 
国产 品类 型 
ar 地 区 名 称 
TEE 
车 统计 日 期 


a 统计 日 期 
T 产品 名 称 





Projected Data Items 


Internet 100% > 





27-40 “Query Explorer” 视 图 


在 视图 中 将 “Data Items” 中 的 “产品 名 称 ” 拖 入 右 侧 的 “Detail Filter” 工 作 区 中 ， 在 
“Expression Definition” 下 的 文本 框 中 输入 “[ 产 品名 称 ]=?cpmc?”， 如 图 27-41 PTR. 


New* — Report Studio — Windows Internet Explorer 


XO AHE SEV KEKA IAT) ABH) 


S € 下 n http: //localhost:9300/p2pd/pat/rsapp. htm vj 加 四 lef) 
TEMP n 一 | 
w d 88|* ew" Folders - Cognos Co... Æ m - Report Studio X | 他 M M et v PI ~ 9 o T x 


| 
AM E- T REAM S? 


pes i dE - v a 




















File Edit View Structure Table Data Run Tools Help 





Help X 


e —— Q s "ejmimmBl:e&Bx[|[ 1n 









o Rib P aio o = 硕 产品 销售 区 域 2 Expression Definition: 
C agg SALES 由 m SALES [产品 名 称 ]=?cpme? 
H 15 (M) D 
轩 产品 名 称 国产 品名 称 
W 产品 类 型 产品 类 型 
地 区 名 称 I 地 区 名 称 
TRE LESS 


8p 统计 日 其 DE 统计 日 其 























E 


_ Z— NN | Q internet & 10$ ~; 
27-4] 表达 式 设置 
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然后 单 击 右 上 和 角 的 “验证 ”按钮 轿 ， 在 弹出 的 页 面 中 ， 选 择 一 个 产品 作为 默认 ， 人 然后 单 
击 “OK” 按 钮 ， 如 图 27-42 所 示 。 


http://localhost:9300/p2pd/servlet/dispatch — Windows Internet Explorer 





THO 编辑 人 于) SEV KEA) IAT) RH) 





Go Y rn http: //localhost:9300/p2pd/servlet/dispatch 


X 4 | 





X 














e" Folders - Cognos Co... 














B news - Report Studio | Æ http: //1ocalhost:93. x | | ta "5 


dh -imEQ-QIAO- ^" 








Provide values for the report you are about to run. 
** Indicates a required field. 


> Points to missing information. 
产品 名 称 
Provide a value: 


“| 中 式 家 具 
产品 名 称 























@ Internet *& 1008 7 . 


图 27-42 “产品 名 称 ” 设 置 
Jo» 


接着 使 用 同样 方法 ， 将 “了 Data Items” 中 的 “地 区 名 称 ” 拖 入 右 侧 的 “Detail Filter" T 
作 区 中 ， 在 弹出 的 窗口 表达 式 定 义 中 输入 “[ 地 区 名 称 ] in ?dqmc?”， 然 后 单 击 右上 角 的 


“验证 ”按钮 天 ， 在 弹出 的 页 面 中 ， 选 择 所 有 7 种 方式 ， 然 后 单 击 “OK” 按 钮 。 最 终 完 成 
的 Detail Filters 如 图 27-43 所 示 。 











sr] Detail Filters 
T [产品 名 称 ]=?cpme? 
[地 区 名称] in ?dqme? 





图 27-43 ”完成 的 Detail Filters 





然后 单 击 “Page Explorer” 中 的 “Page1” 页 面 ， 回 到 页 面 设计 工作 区 ， 如 图 27-44 所 示 。 
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New* — Report Studio —- Windows Internet Explorer 
ba uem AEE SEV KEXA IAT)  $SB5OD 


E] http: //Localhost:9300/p2pd/pat/rsapp. htm 司 | 他 ||x] | 百度 er] 
a- 


B. @ -RITO GIRO. ” 


z z " BrP Folders - Cognos Co.. rm ee Report Studio 
| 国电- |B eed Y H-M-.Ir-BIDO BGB 5 mi? 


D GEHi£ksalexiooie;g»p "TT 全 | 晶 乌 -| 了 和 
Foa le -iA-iszu! ig gHise-iz-—-h« -Im-ig-Euxik-m-dxiw-vm 


. Double edid to edit text 
a mg 产品 销售 区 域 2 


S wj SALES 


[WEM | 产品 名 称 | 地 区 名 称 | BE | 
W mo EE & du. e 


产品 名 称 
产品 类 型 
(ao 地 区 名 称 

















W 


JaJoldx3 Aand oF 


E 
[RR 统计 日 其 























27-44 Report Studio 设置 
接 下 来 ， 将 “产品 名 称 ” 和 “地 区 名 称 ” 分 组 ， 并 且 居 中 显示 。 将 List 靠 左 排列 ， 将 其 
名 称 改 为 “报告 如 下 : ” 修改 “Double click to edit text” 为 “产品 销售 区 域 报告 ” 最 后 ， 保 
存 为 “产品 销售 区 域 报告 ” WR) 27-45 所 示 。 





27-45 工作 区 设置 
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4. 使 用 Report Studio 创建 主页 
用 关 似 前 面 的 步骤 创建 一 个 List 报表 ， 将 “产品 名 称 ” 和 “地 区 名 称 ” 拖 入 到 列表 中 ， 


如 图 27-46 所 示 。 你 存 为 “产品 销售 区 域 汇 总 表 ”。 


New* 一 Report Studio 一 Windows Internet Explorer 
TFE RHE EEV KERA IA 帮助 加) 
一 一人 Nm 
e» e Y eJ http: //localhost:9300/p2pd/pat/rsapp. htm v | 好 | X | | 百度 L |æ] 
3r d ekle My Folders - Cognos Co... [nee - Report Studio X LTETT - Rep... | | t z i h Z [sy mu (Pl OC IAO0 -> 





回回 四 









































File Edit View Structure Table Data Run Tools 
D GiHixmexiooimlmgb-[ab-i€e- tis t iY H-uU- z- iD m B c Bill SN? 


[Font kbe -i&-i»zui&sssintHHi*-i—« a aaa m 





























NETTE H 
a am sales p || 产品 名 称 | 地 区 名 称 
(E) D 8| < 产品 名 称 > < 地 区 名 称 > 
国产 品名 称 < 产品 名 称 > < 地 区 名 称 > 
轩 产品 类 型 < 产品 名 称 > < 地 区 名 称 > 





Ese 




















日 Conditional 


Conditional Styles 
Style Variable 
Render Variable 














完成 m u E Jo [| | | tonet c | Rios - . 


27-46 “产品 销售 区 域 汇总 表 ” 设 置 











5. 制作 Drill-Through 报表 
在 “产品 销售 区 域 汇 总 表 ” 中 ， 右 击 “< 产 品名 称 >” 在 弹出 的 快捷 六 单 中 选择 “Drill- 
Through Definitions" MS, "Blk 27-47 所 示 的 对 话 框 。 


74 Drill-Through Definitions ah X | 


-—— Definitions: 





No Selection 











Bk ae X 





[ œx j| ew | 


27-47 "Drill-Through Definitions" X iE 


450 


单 击 莫 按钮 ， 创 建 一 个 Drill-Through 定义 ， 如 图 27-48 所 示 。 


^4 Drill- Through Definitions 









Mefa dt 
je 
L'Ciault/ 


( 
X 
[ Openin new window 


Parameters: 





^s 


Only when required parameter values are miss 


Q 








27-48 “Drill-Through 定义 ”对 话 框 


单 击 “Target Report” 选 项 卡 中 的 “Report” 右 侧 的 I~ 按钮 ， 在 弹出 的 对 话 框 中 选择 
产品 销售 区 域 报 告 ” 如 图 27-49 所 示 。 

















Wew+ — Report bb Internet Explorer 
TFD AD SEV KEXA IAT 帮助 加 
P mm amm — 
e» Y rn http: //localhost:98300/p2pd/pat/rsapp. htm bc | | 好 | X | | 百度 le -| 
宽 t eg «| e My Folders - Cognos Co... e New* - Report Studio X le FEDERE - Rep... | 一 从 ~ B dh - p mm - GIRO £ 











File Edit View Structure Table Data Run Tools Help | 


D GiHiXx5mu&xioocit;mp [Bte ti8 全 -i 了 外- a Gam”? 

















[Font zje z A -i N 国 | p E- EZA 
| Drill-Through Definitions: 
Drill-Through Definition 1 T tReport kmark bel 二 - _ 
a M r RHEE = : ind iei uc cM 
S Wi SALES epor 
T To PARERES O H 
W 产品 名 称 
TARAH 
Teea 
rip 
DET. 














SS Conditional 
Conditional Styles 
Style Variable 
Text Source Variable — | 





完成 | Internet CY mort 
27-49 "Drill-Through 链接 ”对 话 框 
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然后 将 “Action” 的 值 改 为 “Run the report", “Format” 的 值 改 为 “HTML ”， 如 图 27-50 
所 示 。 



































New* — Report Studio 一 Windows Internet Explorer PEIES 
THEO 8:800 SEU WU SG) IAM 帮助 出) 
op 
eJ € v |É|http://1ocalhost:9300/p2pd/pat/rsapp. htm v | 好 | | X | BE |o B 
w dr gae My Folders - Cognos Co... le New* - Report Studio x CEE - Rep... l | te bd ~ dh X [p Aum X O Iaw A » 





















File Edit View Structure Table Data Run Tools Help | 
D GkHi£xBmexiooidmp-[ajb-i€- tis t-iY 8-U-z-B-ipe 86-9 $i? 
[Font -] [see | Ai Los Drill- Through Definitions Helip X | mic -3iE Lug ie 4. B8 


Target Report | Bookmark | Label 























o gr" DC eco nen 

- jii SALES : 

grs [FEREEHGEE [e] 
a 产品 名 称 Action: 
a 产品 类 型 [Run the report v | 
A Eee : 
ri 
车 统计 日 期 











Display prompt pages: 


[on when required parameter values are miss v | 








OK Cancel 





完成 E ——— A (C Nu 
27-50 “Drill-Through 定义 ”对 话 框 
单 击 腕 按钮 ， 在 参数 对 话 框 中 ,“cpmc” 对 应 的 “Method” 值 为 “Pass data item value", 
“Value ” 值 选 择 “ 产 品名 称 ”; “dqmc” 对 应 的 “Method” 信 为 “Pass data item value”, 
“Value” 值 选择 “地 区 名 称 ” 如 图 27-51 所 示 。 





























New+ 一 Report i Internet Explorer "EIE 
THO 编辑 区) SEV KERA IAW 大助 H) 
IOTA 一 一 
《DC E E) http: //localhost:9300/p2pd/pat/rsapp. htm bé | | 好 | | X | | BE n 
k od [e |-| e My Folders - Cognos Co... e Jewk - Report Studio X | rra ER - Rep... | 从 Mv M = M [s mm 的 区 Q IRO -> 











File Edit View Structure Table Data Run Tools Help | 
D Biistsi&xiooidlmp-[8j-ie-9 tis 但 -1 了 H-s- z- B- [ID D B (Bs ER E? 
[Font z] [sz z] A -i1 p E- E- XZ 2B 


Drill-Through Definitions: 
h Definition 1 | Target Report | Bookmark | Label 
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ce faaee r — — 仆人 人 和 

Si 上 | RR — 

" ID Parameters Help X | 

产品 
a | Method — 1 | 

T cpmc String v Pass data item value [| 国 产品 名称 [z] 

Ems dqmc String v Pass data item value [v] 旱地 区 名 称 [z] 

车 统计 E 











百 | OK Cancel 
日 | Conditional | | Only when required parameter values are miss v 
Conditional Styles IgE CLONES 








Style Variable | pi ale X 


| Text Source Variable 
H ER Date l l [31 l (9 Time 


完成 Internet Qis > . 





27-5] *Drill-Through 变量 设置 ”对 话 框 
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最 终 完 成 的 “Drill-Through Definitions” 对 话 框 的 设置 如 图 27-52 所 示 。 





New* 一 Report Studio 一 Windows Internet Explorer 加 回回 


文件 多) dim) 查看 如 ”收藏 来) IAT) 帮助 0 



































IOTA — Tall 一 
SAZA Ë| http: //1ocalhost:9300/p2pd/pat/rsapp. htm 1 | +| x | 白 度 P - | 
3 d 88|-| Er Folders - Cognos Co... e Jewk - Report Studio X ILU - Rep... | | ^ M dh z nmt) - Z IRW m 
















File Edit View Structure Table Data Run Tools Help 


[Font | [se "| d A -T i R Drill-Through Definitions | 


ENximnim-GcCisXiv-wm 














































NH TETTE speci 
一 AA 
3 Bl Report: 
B SALES 
T ID 奔 品 销售 区 域 报 此 [| 
产品 名 称 Action: 
产品 类 型 [Run the report - Í 
: EESTI i 
HTML v 
[Rs 统计 日 其 | 图 
厂 Open in new window 
Parameters: 
damc 
JL - 
E Display prompt pages: 
5l Conditional [Only when required parameter values are miss v] 
Conditional Styles 
Style Variable [x ale X 
Text Source Variable 












[Lo | ene | 





完成 JE Internet | Qix ~ : 











27-52 "Drill-Through Definitions" X iE 





单 击 “OK” 按 钮 完成 Drill-Through 的 配置 ， 然 后 保存 报表 。 
单 击 “Run Report” 按 钮 ，Report Studio 将 运行 报表 “产品 销售 区 域 汇 总 表 ” 如 图 27-53 
Biz. 
































TERA 朝阳 
EARE 朝阳 
HERR |F 
HERA | AH 
WERA | AX 
PARE 延庆 
田园 家 具 朝阳 
MHARA |8 

MERE 0X 
地 中 海 察 具 ”朝阳 
田园 家 具 | xii 
PEREA | 海 证 
KERA 朝阳 
ERARA | 未 城 
欧 陈 家 上 有 具 BHEH 
地 中 海 家 有 具 CPU 
MAREA |E 
atA 朝阳 
实 林 家具 BST 


27-53 ”运行 报表 
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M ^ €éé «ELI Jo 99 | € Mz 66 Il c Ho 
| Ha T ARAS 到 中 的 数据 现代 家 其 TEES BEC hs TNT 
统 将 跳 转 到 “产品 销售 区 域 报 告 ” W [RI o iA 9 IRI vil HAREA AX Aug 31, 2009 12:00:00 AM | 485 


表 信 息 如 几 27-54 所 示 。 昌平 Oct 16, 2010 12:00:00 AM | 652 

到 | 此 HIE, d MI— 个 完 d 的 Drill-Through A: Jan 1, - 12:00:00 AM ine 
i HUE Apr i, 2009 12:00:00 AM | 286 
H WI o 


图 27-54 ” 跳 转 页 面 
215 kx 


1) Cognos 实例 开发 包含 列表 式 、 图 表 式 、 地 图 式 、 罗 盘 式 等 。 

2) Section 报表 的 开发 在 业务 需求 中 经 单 会 健 到 ， 本 章 介绍 了 该 报表 的 开发 过 程 ， 使 用 
比较 多 的 用 户 包 括 税务 部 门 。 

3) Conditional Style 报表 将 符合 一 定 条 件 的 数据 用 高 之 或 者 其 他 醒目 的 方式 显示 出 来 ， 
其 特点 是 突出 、 明 了 。 

4) 图 表 型 报表 ， 以 其 表达 明确 、 方 便 查 看 、 对 比 清晰 等 特点 被 很 多 的 决策 管理 者 在 工 
作 中 使 用 。 

5) Drill-Through 报表 可 以 追踪 业务 的 明细 或 者 更 高 层级 的 统计 信息 ， 方 便 用 户 动 态 地 
显示 业务 ， 有 助 于 对 业务 数据 进行 分 析 决 傈 。 
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第 28 章 Cognos 的 安全 管理 


本 章 目标 

本 章 主要 介绍 了 Cognos 的 安全 管理 ， 包 括 应 用 防火 场 、 身 份 验证 、 访 问 授 权 等 。 
学 习 本 半 后 ， 您 将 掌握 : 

€ Cognos 的 安全 性 涉及 的 内 容 。 

€ Cognos 的 安全 部 闭 内 容 。 

€ Cognos 的 安全 实践 内 容 。 








28.1 Cognos 安全 性 介绍 














Cognos 的 安全 性 可 以 满足 不 同 的 用 户 安 全 需求 。Cognos 提供 了 一 组 灵活 的 、 可 与 现 有 
系统 安全 模型 进行 羔 容 的 安全 架构 ， 如 图 28-1 所 示 。 它 可 以 很 容易 地 与 第 三 方 映 份 验证 和 
加 蜜 技术 集成 商 进 行 整 合 。 

Cognos 的 安全 性 涉及 以 下 几 点 : 

€ Cognos 应 用 防火 墙 。 

€ Cognos 喘 份 验证 。 

€ Cognos 访问 授权 。 

€ Cognos 加 密 服 务 。 
























Cognos 用 户 界 面 基于 Web、Windows 的 界面 
E 网 络 防火 墙 “ 一 一: — 
s 第 一 层 Web 服务 
HABA X EE > 
MERDA Cognos 应 用 防火 墙 
XR 
= 第 一 层 应 用 Cognos 服务 F 
网 络 防火 墙 ”一 一 一 - pa EE 
第 三 层 数 据 EN 


图 28-1 Cognos 安全 架构 


28.1.1 Cognos 应 用 防火 增 
在 Cognos ZERP, Cognos 应 用 防火 场 CCAF) 是 不 可 或 缺 的 组 件 ， 用 来 帮助 
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Cognos 抵御 外 来 恶意 数据 的 攻击 ， 比 如 绥 存 溢出 和 路 站 脚本 攻击 。 默 认 情 况 下 ，CAF 将 局 
用 ， 并 且 不 能 锐 茶 用 。 


Cognos YHP KISE Dispatcher 层 对 进出 流量 进行 验证 和 过 小 ， 如 图 28-2 Br. 


Cognos Configuration 一 liugf 


同上 回国 
File Edit View ^ Actions Help 


pue Cognos Application Firewall - Component Properties 
Local Configuration 
B- ts Environment 
: [Ey Cognos content database 
: 6 M Logging 
|j L [3l File 
z [: m 8.. 
€ [E Cognos 8 
PO: i Portal Services 
à [S security 
8- A 
Poo [B] Cognos 
: ci oos 
Poe [J| Cognos 
; HE Cognos Application Firewall 
日 - E- Data Access 


(]Nam ooo O ae — 1 ] 
* Enable CAF validation? 
Valid domains or hosts 


True 
«click the edit button 


Is third party X55 checking enabled? False 
Third party X55 characters cm 


a-m Content Manager 

ie cognos 
Nom can 

à Ig Cognos Planning 


Defines a group of properties to configure the Cognos Application Firewall. 


The Cognos Application Firewall is an essential component of product security 
helping to provide protection against penetration vulnerabilities. Disabling the 


Cognos Application Firewall will remove this protection; therefore, this should not be 
| done under normal circumstances. 
— Contributor Data Server 











28-2 Cognos 应 用 防火 墙 


28.1.2 ”身份 验证 


Cognos 8 的 号 份 验证 是 由 第 三 方 吴 份 验证 提供 程序 进行 管理 的 ， 可 以 用 于 定义 组 、 用 


户 、 角 色 ， 如 图 28-3 所 示 。Cognos 8 如 果 使 用 了 刁 份 验证 ， 那 么 用 户 在 登录 时 必须 提供 有 
效 的 身份 任 证 ， 比 如 合法 的 用 户 名 和 有 效 的 密码 等 。 


Cognos 的 身份 验证 包括 : LDAP. Windows NT LAN 管理 、 微 软 的 Active 目录 、eTrust 
Ah eI EL XE X Java 供应 商 。 





Cognos Configuration — liugf 


REIES 
File Edit view Actions Help 


[eT Cognos - Namespace - Resource Properties 
B Local Configuration 
e ts Environment | Type 
I fe E Cognos content database Allow anonymous access? 
| a w Logging 
| | L [| File 
: 9 qc iba 8.. 
MM [E Cognos 8 
M NS Portal Services 
B E Security 
a-m Authentication 
Eu Cognos 
B I ento 
| | tL [J| Cognos 
Ls E mii Application Firewall 
器- E Data Access 
E rg Content Manager 
E duc cognos Use this of properties to control access to resources based on user identity, 
i. Notification Do not delete the namespace, or you will not be able to save your configuration. To 
: restore the namespace, right-click Authentication, click New, Namespace Type, 
晶 - 罗 cognos Planning select the Cognos Namespace from the list of available types and specify a name. 
LL... Contributor Data Server 


Checking service status... 


Defines a group of properties related to authentication that applies to all users. 














28-3 Cognos 身份 验证 
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28.4.3 ”访问 授权 


访问 授权 是 指 授权 一 定 的 用 户 访 问 或 者 拒绝 访问 指定 数据 ， 特 别 是 一 些 行为 或 者 任务 允 
许 或 拒绝 访问 数据 ， 如 图 28-4 所 示 。 

例如 ，Cognos 管理 员 创建 了 一 些 目 隶 ， 用 于 存放 Cognos 报表 ， 那 么 他 们 可 以 设置 这 些 
目录 的 安全 性 ， 以 便 只 有 经 过 授权 的 用 户 才能 查看 、 变 更 或 者 允许 其 他 的 任务 可 以 对 这 些 目 
录 中 的 报表 进行 调度 操作 。 




















. at L] B | g X 5 4 . 
Cognos Adlninistration | | B ifa e RIT. ? ~ 
Status Security Configuration 
B Users, Groups, and Roles Directory > Cognos 过 ai Ba do ax EQ * 


T Capabilities 





Entries: |1 |-115 |© 2 

















User Interface Profiles 





| Name a Modified $ | Actions 





All Authenticated Users August 10, 2011 8:49:45 AM More... 
Analysis Users August 10, 2011 8:49:49 AM More... 
August 10, 2011 1:56:32 PM More... 


n 
- 
o 
= 
3 
o 
c 
mn 


August 10, 2011 8:49:49 AM More... 


e > 
E 
e e = 
3 u 

ud 

fT 

ui 


August 10, 2011 8:49:49 AM More... 
Controller Administrators August 10, 2011 8:49:47 AM More...| 一 
Controller Users August 10, 2011 8:49:49 AM More... 
Data Manager Authors August 10, 2011 8:49:49 AM More... 


Directory Administrators August 10, 2011 8:49:45 AM More... 


DL] DJ DJ D D D D D D D C3 
&BSSSSSSwSSso 


Everyone August 10, 2011 8:49:45 AM More... 





| 和 


图 28-4 Cognos 访问 授权 


1. HP 

用 户 实体 是 指 在 第 三 方 吴 份 验证 供应 商 创建 和 维护 的 唯一 账户 ， 属 于 一 个 特定 的 人 或 者 
一 从 计算机。 

特别 需要 注意 的 是 ， 在 Cognos 中 不 能 创建 用 户 实体 。 

第 三 方 吴 份 验证 供应 商 保存 了 用 户 的 基本 信息 ， 包 括 姓 、 名 字 、 登 录 ID、 密 码 、 本 地 
语言 及 邮箱 等 。 而 Cognos 需要 保存 额外 的 信息 ， 例 如 用 户 的 私人 目录 、 在 portal 中 查看 报 
表 的 格式 参数 等 。 

在 第 三 方 喘 份 验证 供应 商 和 Cognos 中 ， 可 以 将 一 个 用 户 分 配给 一 个 或 者 多 个 组 、 和 角 
色 ， 以 满足 在 业务 中 的 特殊 需求 。 

2. 组 、 角 色 

组 和 和 角色 代表 了 其 有 相同 功能 、 状 态 的 一 些 用 户 的 集合 。 组 的 成 员 可 以 是 其 他 组 或 者 用 
户 ， 如 图 28-5 所 示 ; 角色 的 成 员 可 以 是 用 户 、 组 或 者 其 他 角色 ， 如 图 28-6 所 示 。 




















图 28-5 Cognos 组 的 成 员 关 系 图 28-6 Cognos 角色 的 成 员 关 系 
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28.1.4 WARI 


证 授权 机 制 ， 在 实际 中 可 以 将 其 


加 密 服 务 能 确保 Cognos 通信 和 敏感 数据 的 安全 。 

1. 使 用 第 三 方 授权 认证 

Cognos 8 依赖 于 认证 授权 的 功能 是 加 密 服 务 。 默 认 情 况 下 ，Cognos 8 提供 一 种 简单 的 认 
设置 为 不 可 用 ， 然 后 再 使 用 第 三 方 认 证 授权 。 





2. 标准 的 加 密 服 务 供应 商 

Cognos 包括 以 下 标准 加 和 密 服 务 。 

(1) SSL 

SSL 协议 用 来 保护 Cognos 8 组 件 和 计算 机 之 间 的 安全 通信 。 

(2) 建立 在 BI 总 线 消息 上 的 可 信 请 求 

使 用 可 信 的 数字 签名 以 保证 它们 来 目 于 已 注册 的 Cognos 8 服务 。 
G) BEARES 

在 导入 和 导出 的 过 程 中 使 用 公用 的 算法 来 加 密 和 
(4) 临时 文件 加 密 

公用 的 算法 也 用 来 加 密 和 解密 临时 的 文件 。 
数据 库 中 的 存储 数据 依赖 数据 库 安 全 机 制 来 保护 。 

3. 增强 的 加 密 服 务 供应 商 

如 果 需 要 更 强 的 安全 性 ， 那 么 可 以 使 用 增强 的 加 蜜 服务 来 符 换 标准 的 加 客服 务 。 在 使 用 
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PRE BI JUL: Bat a L Ji ades n] EARS JEU e BE UR 服务 。 但 是 再 要 注意 的 是 : 一 旦 安 狼 了 增强 的 加 


密 服 务 并 在 Cognos 8 中 使 用 它 ， 那 么 将 不 能 


返回 标准 的 加 密 服务 。Cosgnos 加 密 服务 如 图 


28-7 所 示 。 


Cognos Configuration — liugf 
File Edit wiew Actions Help 
ACER | Cognos - Provider - Resource Properties 
B Local Configuration DO Ju — — ————1 


加 -| 三 Environment Type Cognos 
: [EP Cognos content database 





米 Certificate location ..Jconfiguration/cerks 
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zig] Logging 
[i] File 
= Cognos 8... 
: [B Cognos 8 
Portal Services 
日 -| 时 security 
m Authentication 
: Cognos 
=) Cryptography 
| 
Cognos Application Firewall 
5-[& Data Access 
I Content Manager 
cognos 
Notification 
日 Cognos Planning 
Contributor Data Server 


** Confidentiality algorithm 

米 PDF Confidentiality algorithm 

米 Supported ciphersuites 
Identity name 

** Server common name 

米 Organization name 

米 Country code 
Signing key settings 

* Signing key store location 
Signing key store password 
Encryption key settings 

* Encryption key store location 

* Encryption key store password 
Certificate Authority settings 
Use third party CA? 


米 Certificate Authority service common na... 


Password 


米 Certificate Authority key store password 


** Certificate lifetime in days 





RSA security RC4 (40-bit k... 
RSA security RC4 (40-bit k... 
RSA-RSA-DES(56)CBC-SH.... 


CAMLSER 
Cognos 
CA 


..Jconfiguration/signkeypair 
eese spe poop pe peek 


..Jconfigurationjencryptke. . . 
* 


eoe eoo poop 


六 六 冰冰 冰冰 冰冰 冰冰 冰冰 六 冰冰 


730 


Defines a group of properties For the Cognos cryptographic provider. 


Configure these properties to set the encryption services and CA service For all 
components accessing a single content store. 








图 28-7 Cognos 加 密 服 务 








28.2 Cognos 安全 部 署 





Cognos 8 的 安全 策略 目标 是 : 

e 对 于 准备 访问 授权 数据 的 非法 用 户 进行 限制 。 

e 阻止 未 授权 的 用 户 修 改 数据 。 

e 预防 信息 的 丢失 或 毁坏 。 

e 傅 你 应 用 的 可 用 性 。 

必须 确保 未 经 授权 的 用 户 不 能 以 恶意 的 行为 来 访问 数据 ， 也 必须 预防 合法 用 户 在 应 用 和 
使 用 过 程 中 的 各 种 中 断 情况 的 发 生 。 

在 设置 安全 性 时 ， 特 别 需要 注意 以 下 方面 。 

(1) 认证 和 授权 

用 户 的 认证 和 授权 机 制 可 以 预防 未 经 授权 的 用 户 访 问 系 统 组 件 和 数据 。 安 全 策略 的 有 效 
性 依赖 于 认证 和 授权 的 类 型 。 

(2) Web 请 求 和 内 容 验证 

在 数据 传输 之 前 ，Web 请 求 和 内 容 验 证 需要 检查 数据 。 安 全 策略 的 有 效 性 依赖 于 验证 技 
术 ， 例 如 验证 和 预防 缓存 溢出 。 

(3) 会 话 管 理 

安全 策略 的 有 效 性 依赖 于 系统 使 用 的 会 话 管理 的 类 型 ， 包 括 信 息 和 程序 的 生命 周期 需要 
验证 。 

(4) 传输 过 程 中 的 安全 

在 使 用 不 可 信 站 点 的 网 络 时 ， 明 确 哪些 敏感 的 信息 需要 传输 ， 安 全 策略 的 有 效 性 依赖 于 
什么 样 的 数据 和 哪些 数据 需要 加 密 和 传输 。 

(5) 加 密 

加 密 保护 敏感 的 信息 ， 例 如 账户 认证 和 私人 信息 。 

(6) 日 志和 监控 

当 错 误 发 生 、 事 务 结束 时 ， 应 用 程序 将 进行 日 志 标 识 。 此 外 ， 应 用 日 忘记 录 包 括 提供 系 
统 信息 的 错误 信息 ， 访 错误 信息 在 满足 业务 需要 的 同时 ， 应 该 包括 最 少 的 账户 信息 。 安 全 策 
上 略 的 有 效 性 依赖 于 储存 了 哪些 错误 的 日 志 信 息 。 

(7) 管理 员 

管理 员 账 户 包 括 新 增 和 删除 用 户 、 提 供 组 或 者 给 予 角 色 的 访问 、 配 置 应 用 组 件 等 功能 ， 
因此 ， 管 理 员 上 账户 应 该 限制 开放 给 适当 的 人 员 操 作 。 安 全 策略 的 有 效 性 需要 考虑 依赖 于 什么 
样 的 应 用 需求 管理 ， 怎 样 保护 管理 员 的 安全 选项 配置 。 


28.2.1 ”操作 系统 安全 技术 


操作 系统 是 应 用 运行 的 物理 环境 ， 任 何 攻击 操作 系统 的 行为 都 可 能 危害 应 用 程序 的 安 
人 全。 因此， 使 用 安全 的 操作 系统 可 以 使 应 用 环境 达到 较 高 的 稳定 性 。 

系统 的 物理 安全 是 必 不 可 少 的 。 威 胁 可 能 来 目 于 Web， 但 是 也 可 以 来 日 于 一 台 物 理 终 站 
设备 。 假设 Web 访问 是 安全 的 ， 如 采 攻 击 者 可 以 对 一 合 服务 右 进 行 物理 访问 ， 那 么 强行 破 
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坏 系统 是 很 容易 的 。 
建议 您 审查 操作 系统 的 安全 策略 ， 可 以 从 以 下 儿 点 入 手 进行 操作 。 
(OD 用 户 账户 
e 在 服务 器 上 限制 用 户 账 刀 的 数量 。 
e 傅 你 极 少数 的 可 信任 用 户 具 有 超级 管理 员 的 权限 。 
e 授权 特定 用 户 进 行 应 用 的 运行 和 操作 。 
(2) 账户 策略 
e 操作 系统 的 安全 性 可 以 依赖 于 管理 员 的 密码 集 略 。 
e 使 用 增强 的 密码 ， 你 护 系 统 的 安全 性 。 
€ 在 UNIX 系统 下 ， 激 活 shadow 密 公 文件 。 
(3) 文件 系统 
e 授权 用 户 操作 目录 的 只 该 权限 。 
e Usu B RE. 
(4) 网 络 服务 
e 在 便 件 服务 器 上 控制 必要 的 服务 数量 。 
e 降低 用 户 使 用 网 络 服务 的 访问 权限 级 别 。 
e 确保 用 户 账 户 可 以 访问 Web 服务 ， 不 可 以 访问 Shell 功能 。 
€ 在 UNIX 和 Linux 系统 下 ,确保 /etc 目录 下 未 使 用 的 服务 不 存在 re、rc0~rc6 文件 。 
e 在 Window 系统 下 ， 确 保 未 使 用 的 服务 没有 运行 ， 并 且 不 要 设置 成 目 动 运行 。 
@ 在 UNIX 系统 下 ， 确 保 必要 的 服务 的 运行 。 
e 减少 信任 的 六 口 数量 ， 特 别 是 /etc/services 文件 。 
e 保护 系统 免 受 NetBIOS 威胁 ， 例 如 137、138、139 端口 。 
e 使 用 套装 服务 ， 比 如 iptables. 
e 如 果 可 能 ， 尽 量 避 免 使 用 GUI 服务 。 
(5) 系统 补丁 
e 在 操作 系统 上 运行 最 新 的 、 推 荐 的 供应 了 商 的 补丁 。 
e 为 安全 补丁 设置 规律 的 维护 调度 。 
C6) 操作 系统 最 小 化 
@ 删除 非 必要 的 应 用 ， 以 降低 系统 受到 攻击 的 可 能 性 。 
@ 限制 本 地 服务 对 服务 的 操作 。 
e (d DG e 
CI) 日 志和 监控 
e 上 日志 安全 相关 的 事件 ， 包 括 成 功 或 者 失败 的 登录 、 退 出 和 改变 用 户 的 准 入 性 。 
@ 监控 系统 日 志文 件 。 
e 限制 访问 系统 日 志文 件 以 增强 安全 性 。 
@ 安全 日 志 配 置 文件 。 
e 确保 在 Web 服务 器 上 可 以 安全 地 访问 日 志 。 
(8) 系统 的 完整 性 
@ 创建 生产 系统 以 保护 系统 的 完整 性 。 
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e 定期 检查 系统 ， 包 括 和 原始 系统 的 快照 进行 比较 。 
e 使 用 第 三 方 审计 软件 进行 系统 的 完整 性 检 醋 。 
e 基于 一 定 规则 去 备份 系统 的 资源 。 


28.2.2 ”网 络 安全 技术 


网 络 是 进入 应 用 的 一 个 点 ， 因 此 ， 网 络 安全 机 制 是 预防 外 来 入 侵 的 第 一 道 防 线 。 网 络 安 
全 涉及 协议 、 通 信和 通道 和 安全 设备 ， 例 如 路 由 上 费 、 防 火 墙 和 交换 机 。 

可 以 从 以 下 几 个 方面 入 手 来 增强 网 络 安 全 。 

e 合用 防火 场 。 

e 确保 防火 墙 能 提供 包 的 转发 和 过 小 功能 。 

e 限制 访问 交口 的 数量 。 

e 限制 某 些 端口 的 流量 的 方向 。 

e 限制 未 些 网 络 协 议 ， 例 如 ping。 


28.2.3 ”应 用 安全 拉 术 


使 用 内 置 的 安全 功能 ， 可 以 将 Cognos 8 的 安全 性 最 大 化 。 这 里 提供 的 最 好 的 做 法 不 是 
一 个 配置 安全 需求 的 完整 的 列表 ， 以 下 几 点 是 解决 问题 的 关键 。 

(1) 特别 推荐 一 一 使 用 Cognos 应 用 防火 场 

Cognos 应 用 防火 场 (CAF) 补充 了 现 有 Cognos 8 的 安全 架构 。 默 认 情 况 下 ，CAF 是 
可 用 的 。 为 了 确保 Cognos 8 的 解决 方案 是 安全 的 ，CAF 在 生产 环境 中 不 应 该 被 禁用 。 

在 分 布 式 环境 中 ， 所 有 已 安装 的 Cognos 8 应 用 层 组 件 的 计算 机 上 的 CAF 设置 必须 是 一 
WAJ WR CAF 在 茶 些 计算 机 上 是 不 可 用 的 ， 而 在 另 一 些 计 算 机 上 可 用 的 ， 这 样 可 能 会 导 
致 其 他 意外 的 行为 和 产品 错误 的 发 生 。 

CAF 保护 处 理 恶 意 数 据 的 Cognos 8 组 件 。 最 常见 的 形式 是 恶意 数据 的 缓存 区 淤 出 和 中 
站 点 脚本 攻击 (XSS 链接 )， 或 者 通过 在 有 效 的 网 页 或 者 重 定 同 到 其 他 网 站 的 脚本 注入 。 

使 用 Cognos Configuration 时 ， 可 以 改变 第 三 方 的 XSS 工具 文 持 的 设置 ， 并 添加 包括 主 
机 名 和 域名 的 有 效 名 称 的 Cognos 列表 。 

还 可 以 跟 踩 防火墙 活动 ， 检 查 包 含 被 拒绝 请 求 的 日 志文 件 。 默认 情况 下 ， 日 志 信 息 存 储 
在 Cognos 8 本 地 位 置 \logs\ cogserver.log 文件 里 。 

(2) 配置 加 密 环 境 

建议 在 评估 环境 之 前 ， 先 备份 安全 级 别 。 

(3) 安全 的 临时 文件 

Cognos 8 使 用 报告 活动 期 间 的 临时 文件 存储 最 近 合 看 过 的 报告 。 该 文件 是 不 加 密 的 。 由 
于 报告 可 能 包含 敏感 数据 ， 它 们 应 该 是 安全 的 。 

建议 采取 以 下 措施 : 

1) 限制 访问 临时 文件 目录 。 

2) 司 用 临时 文件 加 密 。 

(4) 安全 访问 Cognos Connection 的 技术 

如 果 在 Cognos 配置 中 添加 了 一 个 映 份 验证 ， 那 么 在 目录 中 的 所 有 用 户 都 拥有 访问 
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Cognos Connection 的 权限 。 为 了 确保 Cognos 8 的 安全 ， 和 需要 限制 该 访问 。 

(5) 安全 的 PowerCube 

Ab Cognos 8 PowerCube 的 MDC 文件 继续 留 在 文件 系统 中 。 作 为 一 个 额外 的 安全 指 
施 ， 建 议 : 

1) 设立 限制 PowerCube 数据 源 的 访问 。 

2) PowerCube 的 数据 源 使 用 第 三 方 的 文件 加 黎 系 统 。 

3) 设置 Cognos 8 中 包含 cube 的 目录 的 权限 。 

4) 授予 必须 添加 或 删除 目录 中 的 cube 的 用 户 读 取 和 写 入 权限 。 

5) 授予 用 来 启动 Cognos 8 服务 的 域 用 户 账 户 的 谈 取 权限 。 

C60 安全 的 数据 源 签名 

Cognos 8 使 用 数据 源 签名 来 访问 报表 数据 库 中 的 基础 数据 。 

(7) 安全 的 内 容 存储 

为 了 确保 其 安全 性 和 完整 性 ， 在 Cognos 配置 中 ， 内 容 存 储 通 过 使 用 单数 据 登 录 访 问 
Content Manager 服务 。 

然而 ， 内 容 存 储 的 安全 性 不 仅 依 赖 于 Cognos 8 的 安全 性 ， 而 且 依 赖 于 本 地 数据 库 的 安 
全 性 、 操 作 系 统 的 安全 性 和 网 络 的 安全 性 。 

(8) 为 了 确保 数据 库 的 安全 性 ， 建 议 遵 循 下 列 准 则 

1) 数据 库 和 数据 库 API 使 用 数据 库 、 网 络 和 操作 系统 提供 的 安全 性 机 制 。 

2) 分 配 有 限 数量 的 用 户 以 维护 数据 库 。 

3) 使 用 本 地 安全 的 数据 库 ， 仅 授予 最 低 权限 的 用 户 账户 访问 。 

4) 限制 内 容 管理 表 的 谈 写 访问 的 用 户 数 量 。 

5) 采纳 由 数据 库 供应 丙 提 供 的 其 他 安全 性 建议 。 


282.4 ”安全 审计 


Cognos 8 使 用 安全 审计 作为 管理 方式 来 检查 执行 安全 策略 的 有 效 性 。Cognos 安全 审计 
图 如 图 28-8 所 示 。 



























网 络 防火 墙 


网 络 防火 墙 





图 28-8 Cognos 安全 审计 图 
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28.3 (Cognos 安全 实践 





在 本 节 将 进行 Cognos 安全 性 设置 的 学 习 。 


28.3.1 创建 Cognos 组、 角色 





登录 Cognos Connection 控制 台 后 ， 选 择 “Launch” 一 “Cosgnos Administration ”命令 进 


入 Cognos 管理 界面 ， 如 网 28-9 PZR. 


©) Public Folders — Cognos Connection 加 加 四 





(ny | Public Folders bN Query Studio 


QU analysis Studio 


Public Folders aii E S lh. Report Studio 
(5) Event Studio 


Kj Dril-through Definitions 


y Cognos Administration 











28-9 Cognos 安全 实践 (一) 


Cognos Administration H1 3 部 分 组 成 : Status (状态 )、Security( 安 全) 和 Configuration 
(配置 )， 如 图 28-10 所 示 。 

€ Status OAS): 记录 未 发 生 的 、 当 前 的 和 已 发 生 的 活动 ， 系 统 和 调度 的 信息 。 

€ Security CZE): Cognos 用 户 、 组 和 角色 的 设置 和 管理 。 

€ Configuration (lii EO: 数据 库 连接 、 内 容 管 理 等 信息 。 


a Cognos Ádministrat S 


Cognos Administration Bifa Rd. E, 





Status Security Configuration 


UD current Activities Current Activities - Background activities 


区 Past Activities Total (0) 


SE MN ui = 


b] Upcoming Activities 


(qu System 





($) Background activities ies: x © 
© Interactive activities 











I4|44| P| 





Request time $ Run by Status $ Priority 
No entries. 
Run by: 


Any user ES 
Select a user... | Last refresh time: August 10, 2011 9:14:56 AM | refresh time: August 10, 2011 9:14:56 AM 








28-10 Cognos 安全 实践 (二 ) 
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选择 “Security” 选 项 卡 ， 进 入 后 单 击 “Users, Groups, and Roles” 3%, WK] 28-11 所 示 。 


(9 Cognos Administration 辐 回 加 


(p) 


Cognos Administration Eira è vlanhy ? ~ 


Configuration 
IB Users, Groups, and Roles pem q 





[rj Capabilities 











414«| bp P| 
[B user Interface Profiles 1 | © 





o |€ |Namea | Modified $ | Active | Actions 
gĝ Coanos August i0, 20118:49:48AM — v EST More... 


Last refresh time: August 10, 2011 9:39:16 AM 





28-11 Cognos 安全 实践 (三 ) 


在 右 侧 的 “Directory” 区 域 选 择 “Cognos” 链 接 ， 单 击 后 进入 管理 页 面 ， 如 图 28-12 所 示 。 


© Cognos Adaink stration 加 回国 

Cognos Administration BiA vvLan 中 v ? ~ 
Configuration 

IB] users, Groups, and Roles| Directory > Cognos Cfaf Bf pax eg ^ 


[r3 Capabilities 
User Interface Profiles Entries: 1 n5 | © 4 Poi 


| $ |Namea | Modified $ | Actions 





Ag All Authenticated Users August 10, 20118:49:45 AM — [Sf More.. 
Bp Analysis Users August 10,20118:49:49 AM — [Sf More.. = 
Q anonymous August 10, 2011 8:53:16 AM More... 
B Authors August 10, 2011 8:49:49 AM More.. 
B Consumers August 10, 2011 8:49:49 AM More.. 
BM Controller Administrators August 10, 2011 8:49:47 AM More.. 
By Controller Users August 10, 2011 8:49:49 AM E More. 
By Data Manager Authors August 10, 20118:49:49AM_ [S More.. 
BM Directory Administrators August 10, 2011 8:49:45 AM More.. 
Bg Everyone August 10, 2011 8:49:45 AM More.. 
BR Express Authors August 10, 2011 8:49:49 AM [S vore.. v 
> 





口 
口 
口 
L1 
L1 
o 
L1 
L1 
L1 
L1 
L1 
[1 








图 28-12 Cognos 安全 实践 (由) 
单 击 “ 创 建 组 ”按钮 留 ， 跳 转 至 新 建 组 癌 导 指南 ， 如 网 28-13 所 示 。 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 





Sales 





Description: 
Sales Department 





|» 








Screen tip: 
Sales 











Location: 
Directory > Cognos 
Select another location... 


28-13 Cognos 安全 实践 Ch) 
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单 击 “Next” 投 钮 ， 跳 转 至 选择 用 户 页 面 ， 直 接 单 击 “Finisnh” 按 钮 完成 组 的 创建 ， 如 
图 28-14 所 示 。 


Select the members - New Group wizard Help 


Select the members of this entry. 


Entries:| ]|]-|  ]QO|! «i» 


No entries. 





Add... Remove 


28-14 Cognos 安全 实践 (六) 


组 创建 完成 之 后 ， 返 回 到 列表 页 面 ， 可 以 看 到 刚才 创建 的 “Sales” 组 ， 如 图 28-15 所 示 。 


$ |Namea | Modified $ | Actions 

B Planning Rights Administrators August 10, 2011 8:49:46 AM More... 
让 Portal Administrators August 10, 2011 8:49:46 AM More... 
,5 Query Users August 10, 2011 8:49:49 AM More... 
B Readers August 10, 2011 8:49:49 AM More... 
B Report Administrators August 10, 2011 10:16:59 AM More... 
Bg Sales August 10, 2011 10:16:27 AM More... 


55 Server Administrators August 10, 2011 8:49:45 AM More... 
,5 System Administrators August 10, 2011 8:49:49 AM More... 


Last refresh time: August 10, 2011 10:18:07 AM 


[L] DJ DJ DJ D D D D D] 





28-15 Cognos 安全 实践 (七 ) 


继续 创建 角色 ， 蛙 击 “ 创 建 和 角色” 按钮 睹 ， 跳 转 人 至 新 建 角 色 疝 导 指 南 ， 如 图 28-16 
Bra. 


Specify a name and description - New Role wizard Help 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Directory > Cognos 
Select another location... 


28-16 Cognos 安全 实践 JO 


单 击 “Next” 投 钮 ， 跳 转 至 选择 用 户 页 面 ， 直 接 单 击 “Finisn” 投 钮 完成 角色 的 创建 ， 
如 图 28-17 所 示 。 
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HEUER, Af ue yug. np DLE EER "Leader" AE, W 


Select the members - New Role wizard Help 


Select the members of this entry. 





O| |.» Name 


etres: | |-[ (]O 


No entries. 


| Type 


I4 (44 | iP Pl 











Cancel | | < Back | Next > | | Finish | 





图 28-18 所 示 。 


| Name a 
Bg All Authenticated Users 
$5 Analysis Users 





Q Anonymous 

85 Authors 

$5 Consumers 

B Controller Administrators 
5 Controller Users 

5 Data Manager Authors 
B Directory Administrators 
可 Everyone 

5 Express Authors 

Ba Leader 

By Metrics Administrators 
B Metrics Authors 

Ba Metrics Users 


D- PW PW" P" D" P" P" P" P9" P" P" 3 P3 P3 [9/9 


28-17 Cognos 安全 实践 Ju) 


Add... 


| Modified & 


August 10, 2011 8:49:45 AM 


August 10, 2011 8:49:49 AM 
August 10, 2011 8:53:16 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:47 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:45 AM 
August 10, 2011 8:49:45 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 10:31:42 AM 


August 10, 2011 8:49:46 AM 
August 10, 2011 8:49:49 AM 


August 10, 2011 8:49:49 AM 


Remove 


| Actions 

EST More... 
EST More... 
EST More... 














Last refresh time: August 10, 2011 10:31:48 AM 








28-18 Cognos 安全 实践 CF) 


28.3.2. HHA. ff EGIT Cd 
打开 用 户 、 角 色 、 组 列表 页 面 ， 如 图 28-19 所 示 。 
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Directory > Cognos 


& SS SS wSZEgSo 


| Name 4 

All Authenticated Users 
Analysis Users 
Anonymous 

Authors 

Consumers 

Controller Administrators 
Controller Users 

Data Manager Authors 
B Directory Administrators 
à Everyone 

85 Express Authors 

$5 Leader 

B Metrics Administrators 
B Metrics Authors 

85 Metrics Users 


DL] CJ DJ DJ DJ. DJ. DI. DI. DI. DI. DI. DI. DI. DI. DI. CI 


Cf af Aj x Ea X 2g 
ewes [1 J-E .]O 


| Modified & 


August 10, 2011 8:49:45 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 10:37:07 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:47 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:45 AM 
August 10, 2011 8:49:45 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 10:31:42 AM 
August 10, 2011 8:49:46 AM 
August 10, 2011 8:49:49 AM 
August 10, 2011 8:49:49 AM 


«M 
| Actions 








Last refresh time: August 10, 2011 10:37:07 AM 


28-19 Cognos 安全 实践 〈 十 一 ) 





WAARA, FEDES] “Actions” PRR RARE” eE, NER SUE 
设置 负面 ， 如 图 28-20 rmn. 


Set properties - Leader Help 


General Members Permissions 








Specify the properties for this entry. 


Type: Role Location: Directory > Cognos View the search path, ID and URL 


Owner: Anonymous Created: August 10, 2011 10:31:42 AM 


[7] Disable this entry Modified: August 10, 2011 10:31:42 AM 
Icon: $ Standard Edit... 


The name, screen tip and description are shown for the selected language. 
Language: 


English (United States) * 


Name: Description: 
Leader Sales Leader 


Screen tip: 


Leader 


Advanced routing 











Override the routing sets acquired from the parent entry 
Routing sets: 
No values saved 
Set... 





OK | | Cancel | 
28-20 Cognos 安全 实践 (FZ) 
选择 “Members” 选 项 卡 ， 跳 转 至 用 户 成 员 选 择 页 面 ， 如 图 28-21 BT. 


Set properties - Leader Help 
General Members Permissions 


Select the members of this entry. 








&Ewes | — ]-[  ]Q |! maD 





No entries. 














Add... Remove 
| ok || cane | 
28-21 Cognos 安全 实践 〈 十 三 ) 
单 击 “Add” 按 钮 ， 跳 转 全 选择 用 户 页 面 ， 如 图 28-22 所 示 。 
Select entries (Navigate) - Leader Help 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and dick the arrow button to Type Search 





update the Selected entries list. 


Available entries Selected entries 


Directory Entries: [. ] x [ ] © | «X«I» 


[E] Show users in the list 


Entries: [1 . |- JO | ma 
O| [Name 
aĝ Ccoonos No entries. 











Remove 


28-22 Cognos 安全 实践 〈 十 四 ) 
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选择 “Available entries Directory” 的 “Cognos” 链 接 ， 单 击 后 显示 所 有 用 户 实 体 信 息 ， 
如 图 28-23 所 示 。 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and dick the Type Search ^ 
arrow button to update the Selected entries list. 


Available entries Selected entries 


Cy 
Orsctcy > Cognos ewes[ [本 | mm 


[E] Show users in the list 


Entries: [1 ]-fs ]O! | me 
| Name 
All Authenticated Users No entries. 





Analysis Users 

Authors 

Consumers 

Controller Administrators 
Controller Users 

Data Manager Authors 
Directory Administrators 








Everyone 
Express Authors 


Leader 








qnmnmnumuuuumnemuLmi»trt 
SEESENSSBESSSSSs 


Metrics Administrators Mi 


28-23 Cognos 安全 实践 〈 十 五 ) 


选中 其 中 一 个 用 户 实 体 ， 如 “Sales” 组 ， 单 击 > 按钮， 将 “Sales” 组 添加 到 “Selec 
ted entries ”列表 中 ， 如 图 28-24 所 示 。 


Select entries (Navigate) - Leader Help 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and dick the arrow Type Search 
button to update the Selected entries list. 


Available entries Selected entries 
Directory > Cognos Entries: - @ Id 


E] Show users in the list 


—x [e 
Entries: - [s ]O | [mm O & …>sales 


| Name Remove 


Planning Rights Administrators 
Portal Administrators 

Query Users 

Readers 

Report Administrators 

Sales 


Server Administrators 





m o 
BESGGBSSSSÓE 





System Administrators 


28-24 Cognos 安全 实践 〈 十 六 ) 
Ži “OK” gh, BREl “Members” mE, WK 28-25 所 示 。 


General Members Permissions 





Select the members of this entry. 


Entries: [1 | -1 JO! | [mm 


O| |-> Name | Type 


O dg …> sales Group 
Add... Remove 


28-25 Cognos 安全 实践 〈 十 七 ) 
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单 击 “OK” 按 钮 ， 完 成 对 角色 、 组 的 成 员 实 体 设 置 。 
28.3.3 {E Framework 中 设置 包 的 访问 授权 


在 Framework Manager 中 新 建 一 个 包 ， 如 图 28-26 所 示 。 
输入 包 的 名 称 后 ， 单 击 “Next” 按 钮 ， 如 图 28-27 所 示 。 


C 








reate Package - Provide Name 





x| G 
>= 





reate Package - Define objects — E — 
= P (SA a [— Pr / SH 
Hame: Define the objects rou want to include in this package 
Sales? 
Description: 


(^ Using existing packages 


(* From the project 


E 关上 5ales2 
E- -Jia 





Screen tip: 











Help | 


Cancel | < Back Finish | 
LZ 


图 28-26 Cognos 安全 实践 (十 八 ) 


图 28-27 Cognos 安全 实践 (十 九 ) 
选择 包含 的 对 象 后 ， 单 击 “Next” 按 钮 ， 如 图 28-28 所 示 。 


Create Package 一 Select Function Lists 


-—D N (Gee OC 


Select the set of functions that will be available in this package. 
Available function sets: 





Selected function sets: 
D52 

Informiz 

ASAccess 


Redbrick 


Define Quality of Service | 





Help | Cancel | 


< Back 





图 28-28 Cognos 安全 实践 (二 十 ) 


选择 “Oracle” 函 数 集 ， 单 击 “Finish” 按 钮 完成 对 包 的 创建 ， 如 图 28-29 所 示 。 
单 击 “Yes” 按 钮 ， 在 跳 转 的 发 布 问 导 中 选择 包 发 布 的 路 径 ， 单 击 “Next” 按 钮 ， 如 
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x 


Aa 


图 28-30 所 示 。 


Publish Wizard 一 Select Location Type 








Folder location in the Content Store: 


Directory > Cognos > Anonymous > My Folders Gc | 
dll  — Framevork Nanaeer 


lv Enable model versioning 


Number of model versions to retain (enter 0 for unlimited versions) 
0 


m Delete all previous model versions 


You have successfully created your package. 
Would you like to open the Publish Package wizard? 


(C Location on the network 


Netvork location: 





28-29 Cognos 安全 实践 (二 十 一 ) 28-30 Cognos 安全 实践 (二 十 二 ) 
在 跳 转 的 安全 访问 授权 框 癌 导 中 ， 可 以 进行 两 种 授权 访问 控制 : User Access H Vy i 
控制 ) 和 Administrator Access (管理 员 访 问 控 制 )， 如 图 28-31 所 示 。 


€ User Access 《用 户 访 问 控 制 ): 设置 用 户 访 问 授 权 ， 授 权 的 组 和 角色 可 以 使 用 该 包 来 
创建 报表 等 操作 。 





€ Administrator Access 〈 管 理 员 访问 控制 ): 设置 包 管 理 访问 授权 ， 授 权 的 组 和 角色 可 
以 对 该 包 进 行 管理 。 





Publish Wizard 一 Add Security 


User Access Administrator Access | 


Specify access permissions for this package. These settings are only 
available on the initial publish. 


Selected groups and roles will be able to administer the package. 


[Cognos Role — (Path | 


Remowe | 


Add... | 
New... | 





< Back Cancel | 
28-31 Cognos 安全 实践 (二 十 三 ) 


在 User Access 选项 卡 中 ， 单 击 “Add” 按 钮 ， 弹 出 选择 组 和 角色 对 话 框 ， 如 图 28-32 
所 示 。 
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E Select Users and Groups 
Select entries (Navigate) - Framework Manager 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you wantand Type Search 
dick the arrow button to update the Selected entries list. 





Selected entries - -— 


Entries: — -| Q | 国史 四 四 





r | | Name 
GB Coanos 


Remove 











28-32 Cognos 安全 实践 (二 十 四 ) 
rh “Cognos” BE, REJ ATEEN “Leader” HE, WE 28-33 所 示 。 


L Select Users and Groups 
Select entries (Navigate) - Framework Manager 


^ 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want Type Search = 
and dick the arrow button to update the Selected entries list. 


Available entries Selected entries 
Directory > Cognos Entries: MEN " 六 © | fai 
[^ Show users in the list 一 


Entries: ht — -ps © | ««»» C>] 


Remove 











图 28-33 Cognos 安全 实践 (二 十 五 ) 


将 “Leader” 和 角色 选中 添加 到 右 侧 的 “Selected entries” 列 表 中 ， 如 图 28-34 所 示 。 


^ 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want Type Search = 
and dick the arrow button to update the Selected entries list. 


Available entries - Selected entries 四 
Directory > Cognos Entries: [1 -hh ©! | «m» 
[^ Show users in the list TIGE, 


厂 | |.»Name 
Enies:[1 —-ps © | wx««»» ES 


厂 Ë …> Leader 
T | [Name 


r Ba Leader 
[- RB Metrics Administrators 











Remove 


厂 B Metrics Authors 

厂 B Metrics Users 

厂 B Planning Contributor Users 
[^ B Planning Rights Administrators 
[- B Portal Administrators 

厂 B8 Query Users 





pm m no lA 


全 | 
[ok j][ cne | 








28-34 Cognos 安全 实践 (二 十 六 ) 


451 


单 击 “OK ”按钮 ， 返 回 安全 设置 问 导 页 面 ， 完 成 Cognos Role 的 添加 ， 如 图 28-35 PTR. 
用 同样 的 方法 设置 Administrator Access, WHK] 28-36 所 示 。 





Publish Wizard 一 Add Security 


Spe r this package. These settings are only Specif for this package. These settings are o 


cify access permissions fo ify access permissions 
available on the initial publish. available on the initial publish. 


Selected groups and roles will be able to use this package to create Selected groups and roles will be able to administer the package. 
reports. 








图 28-35 Cognos 安全 实践 〈 二 十 七 ) 图 28-36 Cognos 安全 实践 〈 二 十 八 ) 
单 击 “Next” 按 钮 ， 跳 转 至 发 布 页 面 ， 如 图 28-37 Bon. 
单 击 “Publish” 按 钮 ， 完 成 对 包 的 发 布 ， 如 图 28-38 所 示 。 


Publish Wizard 一 Finish 


DA 
= j 1 


Externalized query subjects You have successfully published the package to the following location: 
Directory > Cognos > Anonymous > My Folders > 3911 事件 





Lr Generate the files for erxternalized query subjects 


Network location: 


v 


Click Publish to publish rour package. 








< Back Publish Cancel | 


图 28-37 Cognos 安全 实践 (二 十 九 ) 图 28-38 Cognos 安全 实践 (三 十 ) 
单 击 “Finish” 按 钮 ， 完 成 包 的 访问 权限 的 设置 。 


284 本 章 小 结 


本 章 介 绍 了 Cognos 的 安全 管理 知识 ， 主 要 包括 以 下 内 容 。 

1) Cognos 安全 性 介绍 一 一 针对 Cognos 应 用 防火 场 、 号 份 验证 、 访 问 授权 和 加 密 服 务 
进行 讲解 ， 旋 者 初步 了 解 了 Cognos 的 安全 机 制 。 

2) Cognos 的 安全 性 可 以 满足 不 同 的 用 户 安 全 需求 。Cognos 提供 了 一 组 灵活 的 、 可 与 现 
有 系统 安全 模型 进行 兼容 的 安全 架构 。 它 可 以 很 容易 地 与 第 三 方 映 份 验 证 和 加 密 技 术 集 成 商 
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进行 整合 。 

3) Cognos 的 安全 性 涉及 以 下 儿 点 : 

€ Cognos 应 用 程序 防火 场 。 

€ Cognos 喘 份 验证 。 

€ Cognos 访问 授权 。 

€ Cognos IRS - 

4) 在 Cognos 安全 架构 中 ，Cognos 应 用 防火 场 CCAFO. 是 不 可 或 缺 的 组 件 ， 用 来 帮助 
Cognos 抵御 外 来 恶意 数据 的 攻击 ， 比 如 绥 存 溢出 和 路 站 脚本 攻击 。 默 认 情 况 下 ，CAEF 将 局 
用 ， 并 且 不 能 被 傈 用 。 

5) Cognos 8 的 喘 份 验证 是 由 第 三 方 吴 份 验证 提供 程序 进行 管理 的 ， 可 以 用 于 定义 组 、 
用 户 、 角 色 。 

6) Cognos 的 身份 验证 包括 : LDAP. Windows NT LAN 管理 、 微 软 的 Active 目录 、 
eTrust 站 点 和 上 自 定 义 的 Java 供应 商 。 

7) 访问 授权 是 指 授权 一 定 的 用 户 访问 或 者 拒绝 访问 指定 数据 ， 特 别 是 一 些 行 为 或 者 任 
务 允 许 或 拒绝 访问 数据 。 

8) 组 和 角色 代表 了 有 共有 相同 功能 、 状 态 的 一 些 用 户 的 集合 。 组 的 成 员 可 以 是 其 他 组 或 
者 用 户 ， 角 色 的 成 员 可 以 用 户 、 组 或 者 其 他 角色 。 

9) Cognos 包括 以 下 标准 加 密 服 务 。 

e SSL: SSL 协议 用 来 保护 Cognos 8 组 件 和 计算 机 之 间 的 安全 通信 。 

e 建立 在 BI 总 线 消息 上 的 可 信 请 求 : 使 用 可 信 的 数字 签名 以 保证 它们 来 和 目 于 已 注册 的 

Cognos 8 服务 。 

e 部 署 过 程 加 密 : 在 导入 和 导出 的 过 程 中 使 用 公用 的 算法 来 加 密 和 解密 数据 。 

e 临时 文件 加 密 : 公用 的 算法 也 用 来 加 密 和 解密 临时 的 文件 。 

10) Cognos 安全 部 署 一 一 从 操作 系统 、 网 络 安全 、 应 用 安全 、 安 全 审计 等 几 个 方面 对 
Cognos 的 安全 部 署 进行 了 系统 分 析 ， 以 期 谈 者 能 有 一 个 全 面 的 安全 防范 意识 。 

11) 为 了 确保 数据 库 的 安全 性 ， 建 议 遵循 下 列 准 则 。 

e 数据 库 和 数据 库 API 使 用 数据 库 、 网 络 和 操作 系统 提供 的 安全 性 机 人 制 。 

e 分 配 有 限 数量 的 用 户 以 维护 数据 库 。 

e 使 用 本 地 安全 的 数据 库 ， 仪 授予 最 低 权 限 的 用 户 账 户 访问 。 

e 限制 内 容 管理 表 的 恋 写 访问 的 用 户 数量 。 

e 采纳 由 数据 库 供 应 丙 提供 的 其 他 安全 性 建议 。 

12) Cognos 安全 实践 一 一 在 进行 了 Cognos 安全 性 介绍 和 安全 部 团 之 后 ， 对 Cognos X 
全 实践 进行 了 人 徐 单 的 演示 。 




































































4535 


"B 29 45€ Cognos 优化 


本 章 目标 

本 章 主 要 介绍 了 Cognos 的 优化 内 容 。 包 括 如 何 增加 Cognos 的 内 存 来 提高 运行 的 速度 ， 
如 何 提高 Cognos 的 数据 库 访问 速度 ， 如 何 通 过 修改 Cognos 的 reportservice.xml 参数 提高 运行 
的 效率 ， 如 何 修改 读 取 高 速 缓存 的 值 来 提升 Cognos 的 性 能 ， 如 何 通 过 开启 crosstab caching 提 
高 cube 的 访问 速度 ， 如 何在 谈 取 数据 时 局 用 多 CPU 处 理 ， 如 何 减 少 cube 数据 提交 的 次 数 等 
内 容 。 

PIRE, KKJ: 

e 如 何 增加 Cognos 8 的 内 存 来 提高 运行 速度 。 

e 如 何 提 高 Cognos 8 的 数据 库 访 问 速 度 。 

e 如 何 修改 Cognos 8 的 reportservice.xml 参数 。 

e 如 何 通 过 修改 读 取 部 速 绥 存 的 值 提 蜗 性 能 

e 如 何 通 过 开启 crosstab caching 提高 cube 的 访问 速度 。 

e 如 何在 读 取 数据 时 启用 多 CPU 处 理 。 

e 如 何 减 少 cube 数据 提交 的 次 数 。 

















20.1 增加 Cognos 8 的 内 存 以 提高 运行 速度 





当 运 行 Cognos 8 的 服务 器 配 置 较 高 时 ， 可 以 适当 增 大 Cognos 8 的 内 存 来 提升 其 运行 的 
效率 。 例 如 ， 在 图 29-1 中 ， 进 入 到 Cognos Configuration， 修 改 下 列 参数 提高 Cognos 8 的 运 
行 速度 ， 如 图 29-2 所 示 。 











c8 - Configuration - Resource Properties 
Ba Local Configuration Value 
HS Environment Type Small configuration 
-m Logging * Ping timeout in seconds 240 
f] Fie 米 Stop wait time in seconds 60 
conesssevee hammen — — um | 
: (am Shutdown port number 999 


过 增加 内 存 提 高 cognos 8 的 性 能 





图 29-1 Cognos 优化 内 存 ( 一 ) 


454 





Deployment fles location [deployment 
Data files location „fdata 

** Map files location ..Imaps 
Temporary fles location .Jtemp 
Encrypt temporary files? False 

* ormas DOCEK AON [BA Ca o 





* Gateway URI hitp:/flocalhost:80/cognosS/cg-binj cognos.cgi 
Gateway namespace 
Allow namespace override? False 

** Dispatcher URIs for gateway hitp:/flocaihost:9300/p2pd|serviet/dispabch/ext 

** Controller URI for gateway hitp:jflocalhost:80/cognosS/controllerServer 
Dispatcher Settings 

er || * External dispatcher URI hitp:/flocalhost:9300/p2pd/serviet/dispakch 

类 Internal dispatcher URI hitp://localhost:9300]p2pd/serviet/dispatch 

Dispatcher password *** ttt nw 


Other URI Settings 
类 Dispatcher URI for external applications hitp:]/localhost:9300/p2pd/servlet/dispakch 了 | 





Specfies the sort buffer size to use For local processing. 


Queries which are not processed entirely within à database server may require local processing that involves sorting. Sorting 
he Which wd overflow to temporary storage For larger sort operations Increasing the sort memory 

arc 仙人 Ted ae AMI HOOK Allocating too much 
" Qu icocutest Oe my apadt hs memory management of the operating system. 


图 29-2 Cognos 优化 内 存 〈 二 ) 





20.2 ”提高 Cognos 8 的 数据 库 访问 速度 


以 Oracle 数据 库 为 例 ， 修 改 存放 在 *\bin 下 的 cogdmorini 文件 ， 打 开 访 文件， 寻找 字 符 
FH Fetch Number of Rows=， 将 其 前 面 的 分 写 去 挥 ， 将 10 改 成 S00。 这 恕 表示 每 次 从 数据 库 
中 取 500 条 数据 ， 大 大 提高 了 对 数据 库 的 访问 速度 。 








29.3 修改 Cognos 8 的 reportservice.xml 参数 





1) 在 Cognos 8 的 安装 目录 下 找到 c8\webapps\p2pd\WEB-INF\services\reportservice.xml 
XN 
例如 : 
max process 
<init-param> 
<!-- The maximum number of processes that can be running at one time --> 
«param-name»max process</param-name> 
<param-value>2</param-value> 
</init-param> 


其 中 <param-value>2</param-value> 表 示 ReportNet 服务 交互 式 报表 处 理 所 占 用 的 进程 个 
数 ， 默 认 值 一 般 为 >。 具体 大 小 可 以 根据 CPU 的 个 数 进行 调整 ， 一 般 每 个 CPU 可 以 支持 两 
个 处 理 进程 数 。 例 如 ， 在 图 29-3 中 该 进程 个 数 和 ReportNet ReportService 服务 中 的 峰值 时 段 
内 报表 服务 的 最 大 进程 数 相 匹配 ， 通 音 非 峰值 时 段 内 报表 服务 的 最 大 进程 数 与 峰值 时 段 内 报 
表 服 务 的 最 大 进程 数 是 相同 的 。 

2) 在 reportservice.xml 文件 中 修改 linger process: 


«init-param^ 











<!-- The minimum number of processes to keep in memory once they're started --> 
«param-name-^linger processc/param-name^ 
«param-value» | «/param-value^ 

</init-param> 
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" 类 别 人 2e 


i 
[ 篇 调整 非 峰 值 时 段 内 报 囊 服务 的 高 亲和力 连接 数 eooo 


[ d 调整 。” 3E RDHERIRSEESRUTEIRSS 


[ de 调整 非 峰值 时 段 内 报表 服务 的 最 大 进程 数 P 


C A 调整 报表 服务 排队 时 间 限 制 ( 秒 数 ) 240 

[ i 调整 。” 报表 服务 的 最 长 执行 时 间 ( 秒 数 ) p —— 
[ 4 调整 — 报表 服务 在 图 表 中 生成 的 热点 数 Doe v 
[ Â 调整 峰值 时 段 内 报表 服务 的 高 亲和力 连接 数 hh 
C Â 调整 。” 峰值 时 段 内 报表 服务 的 低 亲 和 力 连接 数 RR 
[ 4$ 调整 。” 峰值 时 段 内 报表 服务 的 最 大 进程 数 2 

[ à WM ” 报表 服务 的 POF TNI Hz 

[ (à 调整 人 允 洗 报表 服务 在 生成 的 POF 文档 中 嵌入 字体 的 选项 | 允许 到 

[ (à 调整 报表 服务 创建 的 PDF 文档 的 PDF 压缩 类 型 古典 v 

[ (gà 调整 。 报表 服务 创建 鸭 PDF 文档 的 内 容 压缩 级 别 b 











图 29-3 Cognos 优化 进程 (一 ) 


其 中 <param-value>1</param-value> 表 示 ReportNet 服务 交互 式 报表 处 理 初始 化 所 占用 的 
进程 数 。 默 认 值 一 般 为 1， 有 具体 大 小 可 根据 CPU 数 情况 进行 调整 ， 一 般 每 个 CPU 可 支持 一 
个 处 理 进 程 数 ， 设 置 该 参数 的 目的 是 提高 服务 器 在 非 峰值 使 用 时 段 的 处 理 能 力 ， 通 钟 该 参数 
值 小 于 或 等 于 最 大 进程 数 。 


3) 在 reportservice.xml 文件 中 修改 max non affine connections per process. 








«init-param^ 
<!-- The maximum number of non-affine connections per process --> 
«param-name»max non affine connections per process-/param-name^ 
«param-value»4-/param-value^ 
«/init-param» 
其 中 <param-value>4</param-value> 表 示 ReportNet 服务 交互 式 报 表 处 理 所 占 用 的 线程 
数 。 默 认 值 一 般 为 4， 具体 大 小 可 以 根据 CPU 数 情况 进行 调整 ， 一 般 每 个 CPU 最 多 可 以 文 
FF 4 个 处 理 ， 而 Windows 环境 一 般 设 置 成 两 个 处 理 。 在 图 29-4 中 ， 该 线程 数 和 ReportNet 
Report Service 服务 中 的 报表 服务 的 低 杀 和 力 连 接 数 相 匹 配 。 


厂 | | 类 别 $ | 名 称 $ m 
[ d RE SÉGHEDAIRERSOSEQIUSSS NN 
| 站 和 
D i 调整 。 地上 峰值 时 段 内 报表 服务 的 最 大 进程 数 Bp 
[ d HE 报表 服务 排队 时 间 限制 ( 移 数 ) po —— 
[ (d BE 报喜 服务 的 最 长 执行 时 间 ( 秒 数 ) bp 
厂 d RE ”报表 服务 在 图 表 中 生成 的 热点 数 LIN à 
[ (d HE  IGHÉDHERRSESERUTSSS RN 
|T 4 8E WAHEARERSDERRAERR jh 


b 调整 。 峰值 时 段 内 报表 服务 的 最 大 进程 数 

名 调整 “报表 服务 的 POF TRE 

b 调整 。 允许 报表 服务 在 生成 的 PDF Trio Sdn 
e 调整 RERRSORRN POF 文档 的 PDF 压缩 类 型 

e 调整 ”报表 报 务 创建 的 POF 文档 的 内 容 压缩 级 别 


r1 73 DÀ D DH 


Lg 


图 29-4 Cognos 优化 进程 〈 二 ) 
4) 在 reportservice.xml 文件 中 修改 idle process check interval ms. 
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«init-param^ 
<!-- Time period between checks for idle or expired processes (in ms). 
Everytime we check an idle process we bump its tick count. Every time we use 
a process the count is reset to 0. If the count ever reaches the value 
ofidle process max idle ticks (below) the process is destroyed. 
ac 
«param-name-idle process check interval ms«/param-name^ 
«param-value»30000-/param-value^ 
«/init-param^ 
其 中 <param-value>30000</param-value> 表 示 衬 朵 进程 检测 时 间 间 陋 ， 默 认 值 为 30000, 
单位 为 ms。 上 有 目的 是 每 30s 检测 一 下 进程 是 侣 是 空 亲 的， 适当 缩短 时 间 间 隔 ， 可 以 提 融 进 程 
的 使 用 效率 。 
5) 在 reportservice.xml 文件 中 修改 idle process max idle ticks. 


«init-param^ 





<!-- number of idle check ticks before an idle process is killed. --> 
«param-name^idle process max idle ticksc/param-name^ 
«param-value» 10«/param-value^ 
</init-param> 
其 中 <param-value>10</param-value> 表 示 如 果 某 个 进程 连续 10 次 被 检测 为 空闲 进程 ， 则 
该 进程 会 被 杀 皂 。 
6) 在 reportservice.xml 文件 中 修改 queue time limit ms. 
«init-param^ 
<!-- The maximum time a request is queued before it gives up (in ms) --> 
«param-name»queue time limit ms</param-name> 
«param-value»30000-/param-value^ 
«/init-param^ 


H HH «param-value»30000«/param-value? z& zr IR X HR 25 HE BA ERE TR) BR B] ,— 388 65 A A [HC 2 
30000， 单 位 为 ms。 通 常 该 值 和 ReportNet ReportService 服务 中 的 报表 服务 排队 时 间 限 制 
( 秒 数 ) 值 相 匹 配 ， 如 网 29-5 所 示 。 












[7 
调整 SiBDDERSDESIUEES h 
篇 调整 。” 丰 桥 值 时 段 内 报表 服务 的 低 亲 和 力 连 接 数 kooo 
调整 — 非 峰 值 时 自 内 报 素 服务 的 最 大 进程 数 E | 
报 素 服务 排队 时 间 限制 ( 种 数 ) 
报 囊 服 务 的 最 长 执行 时 间 BSO 





图 29-5 Cognos 优化 进程 (三 ) 


20.4 ”修改 读 取 高 速 缓存 的 值 以 提高 性 能 


进入 Cognos Administration 单 击 “ 配 置 ” 一 “数据 源 连 接 ” 单 击 基于 cube 的 数据 源 ， 
单 击 属 性 ， 然 后 在 弹出 的 窗口 中 单 击 连接 ， 修 改 读 取 高 速 绥 存 的 值 ， 如 图 29-6 所 示 。 
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修改 读 取 高 速 缓存 


日 agms 大 小 的 值 


ds 内 容 管理 
a) 通讯 组 和 联系 人 
& 打印 机 

能 st 

IE. portlet 

S UTISEXURA 





RH 
指定 Windows 操作 系统 上 的 多 维 数 据 集 的 位 置 。 如果 多 维 数 据 集 还 存在 于 Unix 或 Linux 操作 系统 上 ， 请 输入 其 位 置 。 





Windows 位 置 : 


[a "我 的 文档 \transformerWpowercubes\First_ Example.mdc 


图 29-6 Cognos 优化 缓存 


29.5 ”开启 crosstab caching 提高 cube 的 访问 速度 


通过 开局 crosstab caching 提高 cube 的 访问 速度 ， 如 图 29-7 所 示 。 


Drill Through | Dimensions | Auto-Partition | Measures 
Cube Group | Data Source | Fackage | Description 
Üutput | General Frocezsing 

Status: 

Üptimiration: 





Default (auto-partition) hu 


而 Thi z cube 1£ 1 Ti all yup d ate d 


rCube creation Procezzed 
(* Enabled (* Locally 
C Disabled C Ün the zerver 


r Cube publishing 
(* Enabled C^ Disabled | 











图 29-7 Cognos 优化 访问 速度 


29.6” 读 取 数 据 时 局 用 多 CPU 处 理 


在 Transformer 中 ， 单 击 “DataSource” 的 属性 页 耐 ， 如 图 29-8 所 示 : 可 以 看 到 有 一 
个 “Enable multi-processing” 复 选 框 ， 如 果 选 中 它 ， 可 实现 读 取 数据 时 启用 多 CPU 人 处理。 
这 样 可 以 大 大 提升 性 能 。 
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Data Source - Products (CSY) : .3 | xl 
Data Source name: Products (CSV) 


Source General | Description 


Timing- 





V Generate categories 
[ EowerCube creation 

(* Default 

C: Generate categories o 
( Create the FPowerCubez 





Uniqueness verification 1 International 
(© Verify category uniqueness Decimal L| 


C Maximize data access Speed 1000 separator: L 








[ Sets the current period 





v Enable guiti processing 


Conteinsz externally rolled up measure values 





图 29-8 Cognos 优化 多 处 理 器 
20.1. 减少 Cuhe 数据 的 提交 次 数 


在 bin\trnsfrmr.ini 文件 中 MaxTransactionNum 的 默认 值 为 S00000， 可 适当 将 其 增 大 ， 例 


如 将 其 修改 为 MaxTransactionNum=1000000， 这 样 会 减少 cube 数据 提交 的 次 数 ， 性 能 相应 得 
到 提高 。 


20.8 本章 小 结 


本 章 介 绍 了 Cognos 的 优化 知识 ， 包 括 以 下 几 点 。 

1) 增加 Cognos 的 内 存 来 提高 运行 的 速度 。 

2) 修改 存放 在 *\bin 下 的 cogdmorini 文件 提高 Cognos 的 数据 库 访 问 速度 。 
3) 通过 修改 Cognos 的 reportservice.xml 参数 提高 运行 的 效率 。 

4) 通过 修改 读 取 融 速 缕 存 的 值 来 提升 Cognos 的 性 能 。 

5) 通过 开局 crosstab caching 提高 cube 的 访问 速度 。 

6) 在 读 取 数据 时 局 用 多 CPU 处 理 ， 以 提高 Cognos 运行 的 效率 。 

7) 减少 cube 数据 提交 的 次 数 以 提升 Cognos 的 性 能 。 
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D 数据 库 的 定义 : 一 系列 物理 文件 及 其 对 应 的 逻辑 结构 被 称 为 数据 库 。 

2) 数据 文件 : 物理 存储 数据 库 的 数据 文件 ， 每 一 个 数据 文件 只 能 对 应 一 个 数据 库 ， 主 
要 包括 数据 表 、 有 索引 和 其 他 的 段 。 

3) 日 志文 件 : 记录 对 数据 库 的 修改 信息 ， 以 备 恢 复数 据 时 使 用 ， 有 其 体操 作 是 每 一 个 数 
据 库 全 少 包 含 两 个 日 六 文件 组 ， 日 记 文 件 组 以 循环 的 方式 进行 谈 写 操作 ， 每 一 个 日 志文 件 对 
应 一 个 物理 文件 。 

4) 控制 文件 ， 是 一 个 较 小 的 二 进 制 文 件 ， 用 于 描述 数据 库 的 结构 。 这 个 文件 会 告诉 用 
户 数据 文件 、 临 时 文件 、 重 做 日 意 文 件 的 位 置 ， 还 包括 一 些 摘 述 性 的 信息 。 

5) 参数 文件 : 包括 确定 内 存 结构 的 大 小 、 设 置 数据 库 的 默认 值 、 设 置 数据 库 的 范围 、 
设置 数据 库 的 各 种 属性 、 优 化 数据 库 的 性 能 等 内 容 。 这 些 参数 文件 同样 会 告诉 Oracle 实例 在 
什么 位 置 可 以 找到 控制 文件 。 

6) 块 : Oracle 管理 存储 空间 最 基本 的 单元 ， 也 是 最 小 的 馆 辑 存储 单元 。 

7) 区 段 ， 比 块 高 一 级 的 逻辑 存储 结构 ， 由 一 系列 块 组 成 。 

8) 段 : 由 多 个 区 段 组 成 ， 区 段 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 

9) RT: 是 最 高 一 级 的 旬 辑 存储 结构 ， 数 据 库 区 是 由 大 二 个 表 衬 间 组 成 的 。 

10) 数据 库 实 例 : Oracle 实例 由 内 存 和 一 系列 后 台 进 程 组 成 。Oracle 实例 是 存储 和 控制 
数据 库 的 软件 机 制 |。 

11) 后 台 进 程 : 主要 功能 是 为 所 有 的 数据 库 用 户 异 步 完 成 各 种 操作 任务 ， 从 而 保证 数据 
库 的 实际 运行 任务 正常 进行 。 

120 内 存 结构 : 主要 包括 系统 全 局 区 (SGA )、 进 程 全 局 区 (PGA )、 用 户 全 局 区 
(UGA). 

13) SGA 《系统 全 局 区 ): FEBRE, HIRIK EHSZEPPRDCRIIX. 

14) 共享 池 : 由 共享 SQL 区 和 数据 字典 区 组 成 ， 参 数 shared pool size 人 确定 共享 池 的 大 












































小 。 

15) 数据 缓冲 区 : 用 于 存储 从 数据 文件 中 读 取 的 数据 备份 和 临时 存储 数据 库 块 的 地 
J 

16) 日 志 绥 冲 区 : 以 记录 项 的 形式 备份 到 数据 缓冲 区 中 被 修改 的 缓冲 块 里 ， 这 些 记 录 被 
写 到 日 志文 件 中 ， 从 而 可 以 加 快 数据 库 的 操作 。 

17) 概念 模型 :一 种 高 层次 的 数据 模型 。 它 定义 了 主要 的 业务 概念 及 其 关系 ， 是 一 个 通 
过 分 析 业 务 竺 求 和 调研 访谈 的 内 容 ， 对 业务 模型 进行 初步 归纳 、 提 人 炼 的 过 程 。 

180 ZEA: 是 概念 模型 的 进一步 分 解 细 化 。 它 换 述 了 实体 、 属 性 以 及 实体 之 间 的 关 
系 ， 一 般 采 用 第 三 范式 。 

19) 物理 模型 : 在 网 辑 模型 的 基础 上 描述 模型 实体 的 细节 ， 包 括 选 择 什 么 样 的 数据 库 平 
台 ， 数 据 库 产 品 所 对 应 的 数据 闫 型 、 长 度 、 索 引 等 因 北 ， 为 滥 辑 模型 选择 一 个 最 优 的 物理 存 
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储 环 境 。 

200 数据 仓库 : 是 一 个 面 同 主题 的 、 集 成 的 、 稳 定 的 、 有 反映 历史 变化 的 、 随 看 时 间 的 流 
逝 发 生变 化 的 数据 集合 。 它 主要 用 来 文 持 企业 管理 人 员 的 决策 分 析 。 

21) 数据 集 市 : 是 满足 特定 的 部 门 或 者 用 户 的 需求 ， 按 照 多 维 的 方式 进行 存储 ， 包 括 定 
义 维度 、 需 要 计算 的 指标 、 维 度 的 层次 等 ， 生 成 面 问 决策 分 析 需 求 的 数据 立方 体 。 

22) OLAP: 联机 分 析 人 处 理 ， 严 文 名 称 OnLine Analysis Processing。OLAP 是 根据 用 户 特 
殊 的 需求 而 进行 的 联机 数据 分 析 ， 包 括 对 数据 仓库 的 分 析 ， 是 业务 分 析 人 员 、 中 层 管 理 人 
员 、 企 业 领 导 者 从 多 角度 对 企业 数据 进行 深入 理解 的 一 类 技术 。 

23) 维度 : 人 们 观察 事物 的 角度 。 

24) Ei: 根据 维度 细节 程度 的 不 同 ， 划 分 数据 在 则 辑 上 的 等 级 关系 ， 用 来 摘 述 维度 的 各 
^ Jj e 

25) 维度 的 成 员 : 维度 的 取 值 ， 即 维度 中 的 各 个 数据 元 素 的 取 值 。 

26) 钻 取 : 通过 变换 维度 的 层次 ， 改 变 粒度 的 大 小 。 

27) 旋转 : 通过 变换 维度 的 方向 ， 重 新 安排 维 的 位 置 ， 例 如 行列 互 换 。 

280 切片 和 切 块 : 在 一 个 或 者 多 个 维度 上 选取 回 定 的 值 ， 分 析 其 他 维度 上 的 度量 数据 ， 
如 果 其 他 维度 和 猎 人 余 两 个 ， 则 是 切片， 如 果 是 3 个 ， 则 是 切 块 。 

290 Biz: 多 维 数 据 的 取 值 。 

30) ROLAP: 是 基于 关系 数据 库 的 OLAP， 以 关系 型 数据 库 为 基础 对 多 维 数据 的 存储 。 

31) MOLAP: 是 基于 多 维 数据 库 的 OLAP， 其 中 切片 、 切 块 是 主要 技术 。 

32) HOLAP: 是 基于 关系 型 和 多 维 窍 阵 型 的 混合 型 的 OLAP。 

33) OLTP: 在 线 联 机 事务 处 理 ， 主 要 面 同 细 贡 性 的 数据 ， 存 储 的 都 是 当前 的 数据 ， 补 
称 作 操 作 型 数据 或 者 是 业务 数据 ， 用 来 文 持 日 前 业务 运作 。 

34) 元 数据 : 在 数据 仓库 系统 的 建立 、 维 护 、 管 理 和 使 用 过 程 中 ， 用 以 描述 实际 数据 的 
信息 ， 古 关于 数据 的 数据 。 

35) 企业 模型 根据 业务 系统 的 特点 ， 用 数据 建 模 的 方法 描述 企业 的 各 种 生产 经 营 活 
动 ， 是 对 业务 系统 的 抽象 ， 是 企业 信息 化 建设 的 基础 。 

36) ODS: 各 个 业务 系统 之 间 共 享 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 
< ERE 。 

37) 星 形 结构 : 主要 包含 事实 表 和 维 表 两 个 部 分 。 事 实 表 主要 由 业务 相关 的 度量 值 和 与 
维 表 相关 联 的 字段 组 成 ， 维 表 是 存放 维度 的 共 体 信息 。 

380 雪人 花形 结构 : 雪花 形 模式 是 在 星 形 模 式 的 基础 上 ， 对 星 形 结 构 的 一 种 拓展 。 通 过 对 
星 形 结构 维 表 的 规范 化 和 细 化 ， 逐 步 建立 起 规范 的 第 三 范式 数据 结构 ， 这 种 结构 在 形式 上 很 
像 委 花形 状 ， 所 以 被 称 为 雪人 花形 结构 。 

39) 数据 建 模 : 是 指 采 用 实体 -关系 的 方法 ， 用 图 形 化 的 形式 去 描述 业务 规则 的 过 程 。 

40) 数据 模型 : 是 指 用 实体 、 实 体 的 属性 、 实 体 之 间 的 关系 对 企业 在 运营 活动 中 涉及 的 
所 有 业务 概念 和 业务 活动 进行 统一 的 定义 和 描述 。 
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